WEB問題集
小売企業のアナリストが、過去2年分の売上データ(BigQueryに格納済み、約500GB)を用いて翌月の売上を予測するモデルを最短で構築したいと考えています。SQLは扱えますがPythonでのMLパイプライン構築経験はありません。最も適切なアプローチはどれですか。
正解:B
正解の根拠
SQL経験のみのアナリストが、BigQuery上のデータをそのまま使って時系列予測を最短で行う場合、BigQuery MLのARIMA_PLUSモデルが最適です。データ移動が不要でCREATE MODEL文だけで学習・予測まで完結します。
| 観点 | BigQuery ML ARIMA_PLUS |
|---|---|
| 必要スキル | SQLのみ |
| データ移動 | 不要(BQ内で完結) |
| 用途適合 | 時系列予測に最適化 |
不正解の理由
- A: TensorFlowでのカスタム実装はPython経験必須で、最短要件に反します。
- C: Pipelines構築は学習コストが高く、SQLのみのアナリストには過剰です。
- D: データのエクスポート工程が不要であり、表形式AutoMLは時系列特化ではありません。
あなたはBigQuery MLでロジスティック回帰モデルを学習しました。学習済みモデルを使い、新しい顧客テーブル new_customers に対してチャーン確率を予測するために実行する関数として正しいものはどれですか。
正解:B
正解の根拠
BigQuery MLで学習済みモデルに対して新しいデータの推論を行うには ML.PREDICT を使用します。SELECT * FROM ML.PREDICT(MODEL my_model, TABLE new_customers) の形式で実行します。
| 関数 | 用途 |
|---|---|
| ML.PREDICT | 分類・回帰の推論 |
| ML.FORECAST | 時系列予測専用 |
| ML.EVALUATE | モデル精度評価 |
不正解の理由
- A: ML.FORECASTはARIMA系の時系列モデル専用であり、ロジスティック回帰には使えません。
- C: ML.EVALUATEは評価指標を返す関数で、推論結果は得られません。
- D: ML.EXPLAINは特徴量寄与度を返す説明関数で、確率予測そのものではありません。
ある運送会社が、商品画像から損傷の有無を自動で判別したいと考えています。社内にはMLエンジニアがおらず、ラベル付き画像が約2000枚あります。最も短期間に高精度モデルを得る方法はどれですか。
正解:D
正解の根拠
カスタムラベル(損傷有無)の画像分類で、ML経験が無くノーコードで高精度を得たい場合はVertex AI AutoML Visionが最適です。データをアップロードし学習をクリックするだけでモデルが構築されます。
| 選択肢 | 適合性 |
|---|---|
| AutoML Vision | カスタムラベル対応・ノーコード |
| Vision API | 事前定義ラベルのみ |
不正解の理由
- A: スクラッチ学習はML専門知識と長い開発期間を要し、要件に合いません。
- B: Vision APIは固定ラベルで、損傷有無の独自分類には対応できません。
- C: 画像内容の特徴を扱うにはピクセル情報が必要で、メタデータだけでは不十分です。
BigQuery MLで CREATE MODEL を実行する際、モデルの種類を指定するオプションとして正しいものはどれですか。
正解:B
正解の根拠
BigQuery MLのCREATE MODEL構文では、モデル種別をOPTIONS句のmodel_typeに指定します。例:CREATE MODEL `ds.m` OPTIONS(model_type='LOGISTIC_REG') AS SELECT ... のように記述します。
| 句 | 役割 |
|---|---|
| OPTIONS | モデル種別やハイパーパラメータの指定 |
| AS SELECT | 学習データのクエリ |
不正解の理由
- A: PARAMSはBigQuery MLの構文ではなく、エラーになります。
- C: WITH句はCTE用であり、モデル種別の指定には使えません。
- D: USING MODEL TYPEという構文はBigQuery MLには存在しません。
顧客サポートチームが、問い合わせメール文面を「請求」「技術」「解約」の3カテゴリへ自動分類するモデルを内製したいと考えています。学習用にラベル付きメールが約5000件あります。コーディング工数を最小化したいとき、どのサービスが最適ですか。
正解:C
正解の根拠
独自ラベルでのテキスト分類をノーコードで実装するならVertex AI AutoML Text Classificationが最適です。CSV/JSONLでラベル付きデータを与えるだけで分類モデルが学習されます。
| サービス | カスタムラベル | コード量 |
|---|---|---|
| AutoML Text | 可 | ほぼ不要 |
| Natural Language API | 不可(事前定義) | 少 |
不正解の理由
- A: エンティティ抽出は単語の意味抽出であり、文書全体の分類には不向きです。
- B: ルールベースは保守性が低く、5000件の学習データを活用できません。
- D: スクラッチ構築は工数最小化の要件に反します。
