sre とは?
Kubernetes インシデント調査、根本原因分析、 そして故障診断。 次の場合に使用します: (1) ポッドが起動しない、スタックする、または失敗する (CrashLoopBackOff、ImagePullBackOff、OOMKilled、Pending)、 (2) Kubernetes エラーのデバッグまたは「なぜ私のポッドは...」を調査する、(3) サービスの低下または利用不能、 (4) Kubernetes インシデントの根本原因分析、(5) トラフィックをブロックするネットワーク ポリシー、 (6) トラブルシューティングが必要な HelmRelease または Flux の障害が停止しました。 トリガー: 「ポッドが起動していません」、「ポッドがスタックしている」、「CrashLoopBackOff」、「ImagePullBackOff」、「OOMKilled」、 「保留中のポッド」、「私のポッドはなぜですか」、「kubernetes エラー」、「k8s エラー」、「サービスが利用できません」、 「サービスにアクセスできません」、「kubernetes をデバッグします」、「k8s のトラブルシューティング」、「ポッドに問題があります」、 「デプロイが機能しない」、「helm のインストールに失敗した」、「flux が調整されていない」、「根本原因」、 「5 つのなぜ」、「インシデント」、「ネットワーク ポリシーのブロック」、「ハッブルのドロップ」、「ヘルムリリースの停止」、 「ライブが更新されていない」、「プロモーション パイプラインがスタックしている」、「アーティファクトがプロモートされていない」 ソース: ionfury/homelab。