Подготовка мониторинга indie SaaS к Black Friday
Black Friday и Cyber Week взрывают трафик, payment webhook и тикеты в поддержку — часто на том же небольшом стеке, что тихо жил во вторники. Мониторинг — не нагрузочное тестирование: он показывает, когда production health URL перестаёт отдавать 200, а не выдержите ли вы 10× concurrent users.
StillOnline выполняет по расписанию HTTP GET, публикует страницу статуса и алертит владельца при сбое внешних проверок. До пика согласуйте окна обслуживания, интервалы проверок и тексты для клиентов — чтобы плановый деплой не выглядел аварией, а реальный инцидент дошёл до вас раньше Twitter.
Краткий ответ
Adobe Analytics зафиксировала $10,8 млрд онлайн-покупок в США в Black Friday 2024 — трафик и нагрузка на checkout сильно выше обычного будня. StillOnline не нагружает ваше приложение. Подготовка: запланированное обслуживание на странице статуса перед рискованными деплоями, пятиминутные внешние проверки (Free) на канонический /health, проверка Telegram или email для алертов владельца в настройках. Масштабирование мощности — отдельно; StillOnline даёт внешнюю правду и канал для клиентов.
Что StillOnline делает и чего не делает
| Возможность | Роль в Black Friday |
|---|---|
| HTTP GET проверки | Обнаруживают сбой health URL снаружи |
| Страница статуса + инциденты | Плановое обслуживание + нарратив аварии |
| Алерты владельца | Вы узнаёте о DOWN раньше, чем взорвётся inbox поддержки |
| Load / stress testing | Не входит — k6, Locust или инструменты хоста |
Мониторинг — дым снаружи здания, не план ёмкости. Если нужна доказательная запас прочности — нагрузочные тесты в staging и метрики инфраструктуры; StillOnline смотрит на production /health.
Чеклист за две недели
| Когда | Действие |
|---|---|
| T−14 дней | Production /health публичный, быстрый (<2 с), 200 — дизайн health |
| T−7 дней | Запланированное обслуживание для schema или infra — гайд по maintenance |
| T−3 дня | Прогон алертов владельца (бот StillOnline, email) через staging-проверку или короткое окно обслуживания |
| T−1 день | Заморозка рискованных деплоев; черновики поста об инциденте и письма клиентам |
| Пиковые дни | Без опциональных деплоев; быстрые обновления публичного timeline |
Окна обслуживания vs цвет проверок
Клиенты читают страницу статуса; внешние проверки — ваш health URL. Согласуйте их намеренно.
| Сценарий | Страница статуса | Проверки |
|---|---|---|
| Плановая миграция БД | Инцидент: Scheduled maintenance, start/end UTC | Могут краснеть ненадолго — напишите об этом в теле |
| Read-only режим | Degraded — логины работают, экспорт медленный | /health 200 с degraded-текстом или 503, если нужен красный |
| Экстренный hotfix | Investigating в течение минут после алерта | Честный красный, когда /health падает |
StillOnline продолжает проверки во время обслуживания, пока вы не меняете target URL. Объясните ожидаемый жёлтый/красный в тексте инцидента — подписчики и те, кто держит страницу в закладках, доверяют timeline больше, чем молчаливой смене цвета.
Интервалы и ложные срабатывания
Free и дефолтный Pro — интервал пять минут; две неудачные проверки подряд → DOWN (~10 минут). В волатильные недели:
| Рычаг | Эффект |
|---|---|
Лёгкий /health | Меньше ложных красных от timeout DB ping под нагрузкой |
| Отдельная глубокая проверка (Pro) | Web liveness на одном URL, БД на втором — мультирегион для географии |
| Частота обновлений инцидента | Обновление публичного поста каждые ~5–15 мин — правило пятиминутных обновлений |
StillOnline не скажет, что CPU на 95% — это dashboard хоста. Комбинируйте: метрики infra для ёмкости, StillOnline для клиентской доступности.
Стек коммуникации
- URL страницы статуса в checkout и API docs до пиковой недели.
- Запланированное обслуживание с UTC-окном перед ночью деплоя.
- Алерты владельца включены — случайный DOWN в «мы думали, всё ок» деплой част на распродажах.
- Email клиентам только при длительных или billing-инцидентах — шаблон: письмо клиентам при аварии.
Регистрация или аудит в StillOnline
- Dashboard → проверки на production HTTPS, не staging.
- Ожидаемый код 200 (или ваш контракт).
- Откройте публичную страницу статуса — ссылка совпадает с тем, что поддержка уже шлёт.
- Команды на Pro: разделите marketing site и API health, если checkout на другом хосте — до 10 URL на проект (тарифы).
Связанные материалы
- Запланированное обслуживание на странице статуса
- Шаблон поста об инциденте для SaaS
- Шаблон письма клиентам при аварии
- Мультирегиональная стратегия health check
FAQ
StillOnline нагружает SaaS перед Black Friday?
Нет. StillOnline выполняет HTTP GET по расписанию на зарегистрированные URL. Планирование ёмкости — отдельные load-инструменты и метрики хоста.
Паузить проверки StillOnline на время обслуживания?
Обычно нет — продолжайте проверки и объясните плановый downtime в инциденте scheduled maintenance. Пауза скрывает случайные сбои в том же окне.
Пятиминутный интервал StillOnline хватит в Cyber Monday?
Для вопроса «доступно ли приложение из интернета?» — да, это задача продукта. Sub-minute детекция latency — не цель HTTP uptime-проверок; смотрите APM и infra рядом со StillOnline.
StillOnline алертит команду в Black Friday без публичной страницы статуса?
Да. Telegram, Slack или email владельца срабатывают на DOWN, даже если страницу не публикуете — но клиентам нужна ссылка, когда ломается checkout; опубликуйте страницу до пика.