← Блог

Шаблон поста об инциденте для indie SaaS

Когда проверки в статусе down, клиентам нужны слова, не только красная точка. Короткий тред инцидента на странице статуса снимает нагрузку с поддержки и выглядит профессионально. Шаблон ниже — для StillOnline; алерты владельца настройте заранее.

StillOnline не пишет текст за вас, но даёт таймлайн, историю проверок и email подписчикам после публикации. Один раз привяжите бота StillOnline, чтобы Telegram разбудил раньше, чем вы откроете кабинет.

Краткий ответ

На странице статуса StillOnline публикуйте четыре фазы — Investigating, Identified, Monitoring, Resolved — с короткими метками UTC. Алерт от бота StillOnline должен прийти раньше текста; подписчики публичной страницы получают email через Google при обновлении инцидента. Ссылку /s/... дайте в макросах поддержки или в соцсетях во время сбоя, а не спрятанной в footer сайта.

Фазы (единые заголовки)

При стрессе читают таймлайн по заголовкам — стабильные фазы лучше «креатива».

ФазаЗаголовокСодержание
1Investigating / РасследуемВидим сбой; причину ищем.
2Identified / Причина найденаЧто сломалось; чиним.
3Monitoring / НаблюдаемФикс выкатили; смотрим проверки.
4Resolved / УстраненоВремя UTC, длительность, итог.

Обновления — в тот же инцидент, таймлайн сверху вниз.

Заготовки текста

Подставьте своё имя продукта; тон — факты.

Расследуем

Расследуем повышенную ошибку на [продукт]. Возможен симптом: [кратко]. Следующее обновление через 30 минут или раньше.

Причина найдена

Причина: [одна строка]. Делаем: [откат / масштабирование / конфиг]. Ожидаемое время: [UTC].

Устранено

Восстановлено в [UTC]. Причина: [кратко]. Длительность: [X] мин. Дальше: [постмортем / меры].

Без обвинений без фактов; без секретов и данных клиентов.

Workflow владельца

На первой строке важнее скорость, чем полировка.

  1. Алерт Telegram/email — привяжите бота StillOnline: гайд.
  2. Кабинет → какая проверка упала.
  3. Investigating на странице за ~10 минут.
  4. Обновления по фактам; Resolved после 2–3 зелёных циклов.
  5. Ссылку /s/... — в автоответ поддержки и соцсети.

Плановые работы — обслуживание.

Чего не писать

Доверие ломается быстрее, чем долгий простой.

  • Stack trace, ключи, внутренние hostname.
  • «Исправлено» до зелёных проверок.
  • Молчание больше часа на красной странице.

После инцидента

Закройте цикл для клиентов и для себя.

  • Короткий постмортем на маркетинговом сайте по желанию.
  • Нет публичной страницы статуса — гайд.

Связанные материалы

FAQ

StillOnline сам создаёт пост инцидента, когда падает проверка?

Состояние инцидента связано с проверкой, но текст для клиентов пишете вы в кабинете. Откройте Investigating в первые минуты после алерта бота StillOnline — шаблон выше; алерты Telegram.

Тот же шаблон инцидента StillOnline на приватной странице статуса?

Да, фазы те же; меняется только кто открывает /s/.... Приватная видимость — Pro: публичная vs приватная.

Проверка StillOnline в down, а продукт «жив» — что писать?

Исправьте URL проверки или опишите частичный сбой честно. Молчание на красной публичной странице хуже короткого Investigating.

Как быстро должен выйти первый пост инцидента в StillOnline?

Ориентир — Investigating примерно за 10 минут после алерта владельца. Подписчики публичной страницы получают email при публикации — публичная страница статуса.