Что такое sre?
Методика отладки SRE для расследования инцидентов Kubernetes, анализа первопричин, и диагностика неисправностей. Используйте, когда: (1) модули не запускаются, зависают или выходят из строя (CrashLoopBackOff, ImagePullBackOff, OOMKilled, Pending); (2) Отладка ошибок Kubernetes или исследование вопроса «почему мой модуль...», (3) Ухудшение качества или недоступность сервиса, (4) Анализ первопричин любого инцидента Kubernetes, (5) Сетевая политика, блокирующая трафик, (6) Остановка HelmReleases или сбои Flux, требующие устранения неполадок. Триггеры: «модуль не запускается», «модуль завис», «CrashLoopBackOff», «ImagePullBackOff», «OOMKilled», «Ожидание модуля», «почему мой модуль», «ошибка kubernetes», «ошибка k8s», «сервис недоступен», «не могу связаться с сервисом», «отладка kubernetes», «устранение неполадок k8s», «что не так с моим модулем», «развертывание не работает», «не удалось установить Helm», «флюс не согласован», «основная причина», «5 почему», «инцидент», «блокировка сетевой политики», «падение Хаббла», «остановка хелмрелиза», «активен, не обновляется», «конвейер продвижения завис», «артефакт не продвигается» Источник: ionfury/homelab.