PDE#2(analyzing)

PDE#2(analyzing)

マーケティング部門は、約 80 億行の購買履歴を BigQuery で分析し、顧客の生涯価値 (LTV) を予測したいと考えています。データサイエンスチームは存在せず、SQL に習熟したアナリストのみで運用する必要があります。モデルの再学習は月 1 回、推論は毎日バッチで実行できれば十分です。最も運用負荷が低い設計はどれですか？

A. Vertex AI Workbench で TensorFlow モデルを構築し、Vertex AI Pipelines で再学習と推論を運用する
B. Dataproc 上の Spark MLlib でモデルを学習し、結果を BigQuery に書き戻す Workflow Template を実行する
C. BigQuery ML で線形回帰または Boosted Tree モデルを CREATE MODEL で構築し、ML.PREDICT を SQL から呼ぶ
D. Cloud Functions から外部 ML API を呼び出して 1 行ずつ推論結果を BigQuery に書き込む

正解と解説ディスカッション 0

正解：C

正解の根拠

BigQuery ML は CREATE MODEL 文と ML.PREDICT 関数によって、SQL のみで回帰や分類モデルの学習と推論を完結できます。データサイエンスチームを持たない組織でも、既存のアナリスト人材だけで LTV 予測のような回帰タスクを構築・運用できる点が大きな利点です。データを BigQuery 外に移動させないためデータ移動コストもかからず、スケジュールクエリで月次再学習と日次推論を自動化できます。

サービス比較

項目	BigQuery ML	Vertex AI Workbench
学習言語	SQL	Python
必要スキル	SQL アナリスト	データサイエンティスト
データ移動	不要	必要に応じ抽出

不正解の理由

A: Vertex AI Workbench は柔軟ですが Python と ML 知識が前提で、運用負荷が高すぎます。
B: Dataproc Spark MLlib はクラスタ運用が必要で、SQL アナリストのみの体制では維持困難です。
D: Cloud Functions の 1 行推論はスループットが低く 80 億行のバッチに非現実的です。

参考：Introduction to BigQuery ML

正解の根拠

サービス比較

不正解の理由

コメント

コメント

コメントするコメントをキャンセル

正解の根拠

サービス比較

不正解の理由

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル