Question#1(Professional Machine Learning Engineer)
あなたはゲーム系スタートアップで働いており、Cloud Storage に数テラバイトの構造化データを保存しています。
このデータには、ゲームプレイ時間データ、ユーザーのメタデータ、ゲームのメタデータが含まれています。
あなたは ユーザーに新しいゲームを推薦するモデル を構築したいと考えており、
最もコーディング量を減らせる方法 を選ぶ必要があります。
何をすべきですか?
正解:B
-
BigQuery ML では
CREATE MODEL ... OPTIONS(model_type='MATRIX_FACTORIZATION')が使える -
レコメンデーションに最も一般的
-
コーディング最小(SQL のみ)
-
大規模データでもスケールする
-
Cloud Storage → BigQuery Load も簡単
BigQuery ML は SQL クエリだけで機械学習モデルを訓練できるため、コーディング量が最小限に抑えられます。推薦システムでは、matrix factorization(行列因子分解)が標準的な手法で、BigQuery ML で直接サポートされています。これにより、ゲームプレイ時間データなどを基にユーザーとゲームの関係性をモデル化できます。

コメント