← Блог

Метки Degraded и outage на странице StillOnline

Major outage при медленном экспорте — минус доверие. Operational при мёртвом входе — лавина тикетов. Метки статуса должны совпадать с тем, что клиент реально может делать.

StillOnline считает общий статус по HTTP-проверкам и даёт ручные инциденты на componentsимена для клиентов.

Краткий ответ

Operational — пробы зелёные, инцидент не открыт. Degraded — некритичная фича или сторонний сервис бьёт один component (Платежи), API зелёный. Major outage / Down — падает основной health URL или большинство клиентов не работает. DOWN в StillOnline — после двух неудачных проб подряд; заголовок инцидента может быть Degraded, если затронут один component. Сторонние статусы.

Таблица решений

Реальность для клиентаМеткаHTTP
Всё окOperationalЗелёный
Медленные отчёты, API окDegraded — ОтчётыЗелёный
Checkout Stripe, API окDegraded — ПлатежиЗелёный на API
Падает /health APIMajor outage — APIКрасный
Сломан входDegraded или Major — ВходЗависит от URL
Плановый деплойMaintenanceокноМожет кратко краснеть

ITIL разделяет деградацию и outage — та же логика для indie. Google SRE — фокус на impact для пользователя, не на внутренних именах.

Типичные ошибки

ОшибкаИсправление
Красный баннер только из-за вендораDegraded + ссылка на status Stripe
Зелёный при мёртвом loginДругой URL или ручной Входauth
Один component «Всё»Разделить API и Панель на Pro
Не закрыли DegradedResolve при конце симптома

Механика StillOnline

  • Авто DOWN — от неудачных проб.
  • Ручные инциденты — Degraded при зелёных пробах.
  • Component сужает blast radius на публичном таймлайне.

Связанные материалы

FAQ

Отдельное состояние «Degraded» у пробы?

Проверки up/down (+ PROBE_LIMITED). Degraded — обычно ручной инцидент при зелёных пробах.

Major outage при 500 на одном endpoint?

Если это единственный мониторимый URL — да; иначе Degraded на component.

Free, один URL — показать Degraded?

Да через ручной инцидент при зелёной проверке.