【GAIL】WEB問題集:生成AIの基礎編

WEB問題集

GAIL#1(genai-fundamentals)

ある製造業の企画チームが、識別 AI (Discriminative AI) と生成 AI (Generative AI) の違いを社内研修で説明します。両者の違いに関する説明として正しいものはどれですか。(2 つ選択)

(2つ選択)

正解:A, D

正解の根拠

識別 AI は入力 X から条件付き確率 P(Y|X) を学習し、分類や回帰でラベル・数値を出力します。一方、生成 AI は P(X) もしくは P(X|条件) を学習し、テキストや画像など新しいサンプルを生成します。両者の差はタスクの目的と確率モデルの形にあり、ハードウェアや学習方式の違いではありません。

サービス比較

項目識別 AI生成 AI
目的分類・予測新規コンテンツ生成
学習対象P(Y|X)P(X) または P(X|条件)
代表例画像分類、与信スコアGemini、Imagen

不正解の理由

  • B: GPU/CPU の利用はモデル規模で決まる話で、AI 種別の本質的な違いではありません。
  • C: 両者とも教師あり、自己教師あり、強化学習など複数手法を組み合わせて学習可能です。

参考:What is generative AI?

GAIL#2(genai-fundamentals)

ある金融機関がカスタマーサポート用に大規模言語モデル (LLM) の導入を検討しています。LLM の基盤となるアーキテクチャとして最も広く採用されているものはどれですか?

正解:A

正解の根拠

現在主流の LLM (Gemini、PaLM、GPT 系など) は、2017 年に発表されたトランスフォーマーアーキテクチャを基盤としています。自己注意機構 (Self-Attention) により、長い文脈の依存関係を並列に処理でき、RNN の逐次処理ボトルネックを解消した点が大規模化を可能にしました。

サービス比較

項目TransformerRNN
並列処理可能逐次のみ
長距離依存得意勾配消失で苦手
代表モデルGemini、BERTLSTM、GRU

不正解の理由

  • C: CNN は主に画像認識で空間的特徴を捉える設計で、長文の文脈処理には不向きです。
  • B: RNN は逐次処理で長文の学習が遅く、現代の LLM では主要アーキテクチャではありません。
  • D: SVM は古典的な分類アルゴリズムで、生成タスクや大規模学習には適しません。

参考:What is a Large Language Model (LLM)

GAIL#3(genai-fundamentals)

ある社内ヘルプデスクが Gemini を試験導入したところ、存在しない社内規程を引用する回答が時々生成され問題となりました。この現象を何と呼びますか?

正解:C

正解の根拠

ハルシネーションとは、LLM が事実に基づかない情報をもっともらしく生成する現象です。学習データに含まれない最新情報や、社内固有データを問われた際に発生しやすく、Grounding (RAG や Vertex AI Search との連携) や引用付き応答で抑制するのが一般的な対策となります。

サービス比較

項目ハルシネーションオーバーフィッティング
発生段階推論時学習時
原因知識不足、生成の確率性訓練データへの過学習
主な対策RAG、Grounding正則化、データ拡張

不正解の理由

  • A: オーバーフィッティングは訓練データに過剰適合し汎化性能が下がる現象で、別概念です。
  • B: データドリフトは本番データ分布が学習時と乖離する現象で、ハルシネーションとは異なります。
  • D: アンダーサンプリングはデータ不均衡対策の手法で、生成内容の誤りとは無関係です。

参考:What are AI hallucinations?

GAIL#4(genai-fundamentals)

ある教育系スタートアップが Gemini を用いて画像と音声と文章を同時に解析する学習支援アプリを開発しています。複数の形式の入力を扱える AI モデルを何と呼びますか?

正解:C

正解の根拠

マルチモーダルモデルは、テキスト、画像、音声、動画など複数のモダリティを同時に処理できるモデルを指します。Gemini はネイティブにマルチモーダル設計されており、画像入力からテキスト応答を返したり、動画を要約することが可能です。学習支援のように複数形式を扱うユースケースに適しています。

サービス比較

項目マルチモーダルシングルモーダル
入力形式テキスト、画像、音声等1 種類のみ
代表モデルGemini初期 BERT 等
ユースケース動画解析、図表理解テキスト分類

不正解の理由

  • B: シングルモーダルはテキストのみ等 1 形式に限定され、画像と音声を同時に扱えません。
  • A: アンサンブルは複数モデルの結果を統合する技法で、複数モダリティ処理とは別概念です。
  • D: ブースティングは弱学習器を直列に学習させる手法で、モダリティ対応とは無関係です。

参考:Multimodal models overview

GAIL#5(genai-fundamentals)

ある法律事務所が Gemini を活用するにあたり、責任ある AI (Responsible AI) の観点で重視すべき要素は次のうちどれですか。(2 つ選択)

(2つ選択)

正解:B, D

正解の根拠

Google Cloud の Responsible AI Principles では、公平性、説明可能性、プライバシー、安全性、説明責任などが柱として掲げられています。法律業務のように判断結果が人に影響する分野では、特定属性に対する偏りを避ける公平性と、AI の出力根拠を人間が確認できる説明可能性が重要となります。

サービス比較

項目公平性説明可能性
目的差別的出力の抑制意思決定の根拠提示
手段バイアス監査、データ多様化特徴量重要度、Citation
関連機能Model CardsVertex Explainable AI

不正解の理由

  • A: 学習時間の短縮は運用効率の観点で重要ですが、責任ある AI の中核原則ではありません。
  • C: コストのみを優先するとリスク管理が疎かになり、責任ある AI の趣旨に反します。

参考:Responsible AI at Google Cloud