PDE#2(analyzing)
マーケティング部門は、約 80 億行の購買履歴を BigQuery で分析し、顧客の生涯価値 (LTV) を予測したいと考えています。データサイエンスチームは存在せず、SQL に習熟したアナリストのみで運用する必要があります。モデルの再学習は月 1 回、推論は毎日バッチで実行できれば十分です。最も運用負荷が低い設計はどれですか?
正解:C
正解の根拠
BigQuery ML は CREATE MODEL 文と ML.PREDICT 関数によって、SQL のみで回帰や分類モデルの学習と推論を完結できます。データサイエンスチームを持たない組織でも、既存のアナリスト人材だけで LTV 予測のような回帰タスクを構築・運用できる点が大きな利点です。データを BigQuery 外に移動させないためデータ移動コストもかからず、スケジュールクエリで月次再学習と日次推論を自動化できます。
サービス比較
| 項目 | BigQuery ML | Vertex AI Workbench |
|---|---|---|
| 学習言語 | SQL | Python |
| 必要スキル | SQL アナリスト | データサイエンティスト |
| データ移動 | 不要 | 必要に応じ抽出 |
不正解の理由
- A: Vertex AI Workbench は柔軟ですが Python と ML 知識が前提で、運用負荷が高すぎます。
- B: Dataproc Spark MLlib はクラスタ運用が必要で、SQL アナリストのみの体制では維持困難です。
- D: Cloud Functions の 1 行推論はスループットが低く 80 億行のバッチに非現実的です。

コメント