SOA-C03#1(monitoring)

SOA-C03#1(monitoring)

運用チームは本番 EC2 群の CPU 使用率について、夜間バッチ実行時にだけ閾値を変えたいと考えています。曜日や時間帯ごとの正常レンジを学習し、想定外のピークだけを検知したい場合、最も運用負荷が低い方法はどれですか。

ディスカッション 0

正解:A

正解の根拠

CloudWatch Anomaly Detection はメトリクスの過去 2 週間のパターンから時間帯や曜日別の期待レンジを自動学習し、バンド外の値だけをアラーム化できます。固定閾値の切り替え運用が不要になり、夜間バッチで CPU が高くても期待範囲内なら誤検知を抑制できます。

主要監視手法の比較

方式動的閾値運用負荷
固定アラーム不可高(時間帯ごとに調整)
Anomaly Detection可(自動学習)
カスタム Lambda可(自作)非常に高
Synthetics不可(外形監視)

設定例

aws cloudwatch put-metric-alarm 
  --alarm-name cpu-anomaly 
  --metric-name CPUUtilization 
  --namespace AWS/EC2 
  --threshold-metric-id ad1 
  --comparison-operator GreaterThanUpperThreshold 
  --evaluation-periods 2

不正解の理由

  • B: 固定閾値切替方式は時間帯ごとの正常レンジ学習機能を持たない副作用があり、運用負荷も高くなる方式です。
  • C: Synthetics は外形監視が目的のサービスで、CPU メトリクスの異常検知機能は備えていない設計目的です。
  • D: 自作モデル方式は実装と保守コストが大きい副作用があり、Anomaly Detection のマネージド機能の代替には設計負荷が大きい構成です。

参考:CloudWatch Anomaly Detection


コメント

コメント

コメントする

目次