PCDBE#403(deploy-monitor)

PCDBE#403(deploy-monitor)

SaaS プロダクトを運用するチームは、Cloud SQL の CPU 使用率が業務時間に急増する事象を観測しています。CPU が 80% を超えた際にオンコール担当に通知し、さらに 90% を超え 5 分間継続した場合のみエスカレーションを発生させたいと考えています。最小の管理コストで実現する方法はどれですか。

ディスカッション 0

正解:C

正解の根拠

Cloud Monitoring のアラートポリシーは Cloud SQL の CPU 使用率メトリクス(database/cpu/utilization)を直接参照でき、複数の条件としきい値を設定可能です。通知チャネルとして PagerDuty・Slack・メールなどを連携でき、追加実装なしで段階的な通知が実現します。

方式運用負荷遅延
Cloud Monitoring アラート数十秒
独自スクリプト不安定
BigQuery クエリ1時間以上

不正解の理由

  • A:自前実装は障害時に通知自体も停止する単一障害点になります。
  • B:BigQuery 経由は遅延が大きく、リアルタイム通知に不向きです。
  • D:ログベース指標は CPU メトリクスではなくログ事象向けの仕組みです。

参考:https://cloud.google.com/monitoring/alerts


コメント

コメント

コメントする

目次