PDE#2(analyzing)

PDE#2(analyzing)

マーケティング部門は、約 80 億行の購買履歴を BigQuery で分析し、顧客の生涯価値 (LTV) を予測したいと考えています。データサイエンスチームは存在せず、SQL に習熟したアナリストのみで運用する必要があります。モデルの再学習は月 1 回、推論は毎日バッチで実行できれば十分です。最も運用負荷が低い設計はどれですか?

ディスカッション 0

正解:C

正解の根拠

BigQuery ML は CREATE MODEL 文と ML.PREDICT 関数によって、SQL のみで回帰や分類モデルの学習と推論を完結できます。データサイエンスチームを持たない組織でも、既存のアナリスト人材だけで LTV 予測のような回帰タスクを構築・運用できる点が大きな利点です。データを BigQuery 外に移動させないためデータ移動コストもかからず、スケジュールクエリで月次再学習と日次推論を自動化できます。

サービス比較

項目BigQuery MLVertex AI Workbench
学習言語SQLPython
必要スキルSQL アナリストデータサイエンティスト
データ移動不要必要に応じ抽出

不正解の理由

  • A: Vertex AI Workbench は柔軟ですが Python と ML 知識が前提で、運用負荷が高すぎます。
  • B: Dataproc Spark MLlib はクラスタ運用が必要で、SQL アナリストのみの体制では維持困難です。
  • D: Cloud Functions の 1 行推論はスループットが低く 80 億行のバッチに非現実的です。

参考:Introduction to BigQuery ML


コメント

コメント

コメントする

目次