PCDE#1(incident-management)

PCDE#1(incident-management)

本番サービスで全リージョン障害が発生しました。最初に着手すべきプロセスはどれですか。

ディスカッション 0

正解:C

正解の根拠

インシデント対応プロセスは Detect → Respond → Mitigate → Resolve の順で進めます。検知が起点です。

段階目的
Detect異常を発見
Respond応答開始
Mitigate影響緩和
Resolve根本解消

不正解の理由

  • Postmortem は Resolve 後に行います。
  • SLO 再設計はインシデント中の作業ではありません。
  • オンコール再編成は別タスクです。

参考:Google SRE Managing Incidents


コメント

コメント

コメントする

目次