【GAIL】WEB問題集:生成AIの基礎編

WEB問題集

GAIL#1(genai-fundamentals)

ある製造業の企画チームが、識別 AI (Discriminative AI) と生成 AI (Generative AI) の違いを社内研修で説明します。両者の違いに関する説明として正しいものはどれですか。(2 つ選択)

（2つ選択）

A. 識別 AI は入力データのクラスや値を予測し、生成 AI は新しいコンテンツを生成します
B. 識別 AI は GPU が必須で、生成 AI は CPU だけで動作するという特徴があります
C. 識別 AI は教師あり学習のみ、生成 AI は強化学習のみを使うと定義されています
D. 識別 AI は P(Y|X) を学習し、生成 AI は P(X) や P(X|条件) を学習します

正解：A, D

正解の根拠

識別 AI は入力 X から条件付き確率 P(Y|X) を学習し、分類や回帰でラベル・数値を出力します。一方、生成 AI は P(X) もしくは P(X|条件) を学習し、テキストや画像など新しいサンプルを生成します。両者の差はタスクの目的と確率モデルの形にあり、ハードウェアや学習方式の違いではありません。

サービス比較

項目	識別 AI	生成 AI
目的	分類・予測	新規コンテンツ生成
学習対象	P(Y\|X)	P(X) または P(X\|条件)
代表例	画像分類、与信スコア	Gemini、Imagen

不正解の理由

B: GPU/CPU の利用はモデル規模で決まる話で、AI 種別の本質的な違いではありません。
C: 両者とも教師あり、自己教師あり、強化学習など複数手法を組み合わせて学習可能です。

参考：What is generative AI?

GAIL#2(genai-fundamentals)

ある金融機関がカスタマーサポート用に大規模言語モデル (LLM) の導入を検討しています。LLM の基盤となるアーキテクチャとして最も広く採用されているものはどれですか？

A. トランスフォーマー (Transformer)
B. 再帰型ニューラルネットワーク (RNN) と LSTM を組み合わせた構成
C. 畳み込みニューラルネットワーク (CNN) を多層に積み重ねた構成
D. サポートベクターマシン (SVM) を多段に並べた古典的な構成

正解と解説ディスカッション 0

正解：A

正解の根拠

現在主流の LLM (Gemini、PaLM、GPT 系など) は、2017 年に発表されたトランスフォーマーアーキテクチャを基盤としています。自己注意機構 (Self-Attention) により、長い文脈の依存関係を並列に処理でき、RNN の逐次処理ボトルネックを解消した点が大規模化を可能にしました。

サービス比較

項目	Transformer	RNN
並列処理	可能	逐次のみ
長距離依存	得意	勾配消失で苦手
代表モデル	Gemini、BERT	LSTM、GRU

不正解の理由

C: CNN は主に画像認識で空間的特徴を捉える設計で、長文の文脈処理には不向きです。
B: RNN は逐次処理で長文の学習が遅く、現代の LLM では主要アーキテクチャではありません。
D: SVM は古典的な分類アルゴリズムで、生成タスクや大規模学習には適しません。

参考：What is a Large Language Model (LLM)

GAIL#3(genai-fundamentals)

ある社内ヘルプデスクが Gemini を試験導入したところ、存在しない社内規程を引用する回答が時々生成され問題となりました。この現象を何と呼びますか？

A. オーバーフィッティング (Overfitting)
B. データドリフト (Data Drift)
C. ハルシネーション (Hallucination)
D. アンダーサンプリング (Undersampling)

正解と解説ディスカッション 0

正解：C

正解の根拠

ハルシネーションとは、LLM が事実に基づかない情報をもっともらしく生成する現象です。学習データに含まれない最新情報や、社内固有データを問われた際に発生しやすく、Grounding (RAG や Vertex AI Search との連携) や引用付き応答で抑制するのが一般的な対策となります。

サービス比較

項目	ハルシネーション	オーバーフィッティング
発生段階	推論時	学習時
原因	知識不足、生成の確率性	訓練データへの過学習
主な対策	RAG、Grounding	正則化、データ拡張

不正解の理由

A: オーバーフィッティングは訓練データに過剰適合し汎化性能が下がる現象で、別概念です。
B: データドリフトは本番データ分布が学習時と乖離する現象で、ハルシネーションとは異なります。
D: アンダーサンプリングはデータ不均衡対策の手法で、生成内容の誤りとは無関係です。

参考：What are AI hallucinations?

GAIL#4(genai-fundamentals)

ある教育系スタートアップが Gemini を用いて画像と音声と文章を同時に解析する学習支援アプリを開発しています。複数の形式の入力を扱える AI モデルを何と呼びますか？

A. アンサンブルモデル
B. シングルモーダルモデル
C. マルチモーダルモデル
D. ブースティングモデル

正解と解説ディスカッション 0

正解：C

正解の根拠

マルチモーダルモデルは、テキスト、画像、音声、動画など複数のモダリティを同時に処理できるモデルを指します。Gemini はネイティブにマルチモーダル設計されており、画像入力からテキスト応答を返したり、動画を要約することが可能です。学習支援のように複数形式を扱うユースケースに適しています。

サービス比較

項目	マルチモーダル	シングルモーダル
入力形式	テキスト、画像、音声等	1 種類のみ
代表モデル	Gemini	初期 BERT 等
ユースケース	動画解析、図表理解	テキスト分類

不正解の理由

B: シングルモーダルはテキストのみ等 1 形式に限定され、画像と音声を同時に扱えません。
A: アンサンブルは複数モデルの結果を統合する技法で、複数モダリティ処理とは別概念です。
D: ブースティングは弱学習器を直列に学習させる手法で、モダリティ対応とは無関係です。

参考：Multimodal models overview

GAIL#5(genai-fundamentals)

ある法律事務所が Gemini を活用するにあたり、責任ある AI (Responsible AI) の観点で重視すべき要素は次のうちどれですか。(2 つ選択)

（2つ選択）

A. 学習時間の最短化を最優先する設計判断を採用する方針
B. 公平性 (Fairness) の確保
C. 推論コストの最小化のみに集中する運用方針を選択する
D. 説明可能性 (Explainability) の確保

正解と解説ディスカッション 0

正解：B, D

正解の根拠

Google Cloud の Responsible AI Principles では、公平性、説明可能性、プライバシー、安全性、説明責任などが柱として掲げられています。法律業務のように判断結果が人に影響する分野では、特定属性に対する偏りを避ける公平性と、AI の出力根拠を人間が確認できる説明可能性が重要となります。

サービス比較

項目	公平性	説明可能性
目的	差別的出力の抑制	意思決定の根拠提示
手段	バイアス監査、データ多様化	特徴量重要度、Citation
関連機能	Model Cards	Vertex Explainable AI

不正解の理由

A: 学習時間の短縮は運用効率の観点で重要ですが、責任ある AI の中核原則ではありません。
C: コストのみを優先するとリスク管理が疎かになり、責任ある AI の趣旨に反します。

参考：Responsible AI at Google Cloud