PCDBE#403(deploy-monitor)
SaaS プロダクトを運用するチームは、Cloud SQL の CPU 使用率が業務時間に急増する事象を観測しています。CPU が 80% を超えた際にオンコール担当に通知し、さらに 90% を超え 5 分間継続した場合のみエスカレーションを発生させたいと考えています。最小の管理コストで実現する方法はどれですか。
正解:C
正解の根拠
Cloud Monitoring のアラートポリシーは Cloud SQL の CPU 使用率メトリクス(database/cpu/utilization)を直接参照でき、複数の条件としきい値を設定可能です。通知チャネルとして PagerDuty・Slack・メールなどを連携でき、追加実装なしで段階的な通知が実現します。
| 方式 | 運用負荷 | 遅延 |
|---|---|---|
| Cloud Monitoring アラート | 低 | 数十秒 |
| 独自スクリプト | 高 | 不安定 |
| BigQuery クエリ | 中 | 1時間以上 |
不正解の理由
- A:自前実装は障害時に通知自体も停止する単一障害点になります。
- B:BigQuery 経由は遅延が大きく、リアルタイム通知に不向きです。
- D:ログベース指標は CPU メトリクスではなくログ事象向けの仕組みです。

コメント