WEB問題集
正解:B
正解の根拠
Amazon SageMaker は AWS のフルマネージド ML サービスで、データ準備からモデル訓練、デプロイ、推論までライフサイクル全体をカバーします。SageMaker Automatic Model Tuning (AMT) はベイズ最適化や Hyperband などの戦略でハイパーパラメータを自動探索し、完全自動化されたモデルチューニングを実現します。SageMaker Autopilot を使えばアルゴリズム選定からチューニングまでさらに完全自動化できます。
AWS ML サービス比較
| サービス | 用途 |
|---|---|
| SageMaker | カスタム ML、自動チューニング |
| Personalize | レコメンデーション専用 |
| Comprehend | NLP マネージド (感情分析等) |
| Athena | SQL クエリエンジン |
不正解の理由
- A: Personalize はリコメンデーション用途のマネージドサービスで、自由なモデル設計やハイパーパラメータチューニングは提供しません。
- C: Athena は S3 上のデータに SQL クエリを実行する分析サービスであり、ML モデル構築機能は提供していません。
- D: Comprehend はテキストの感情分析やエンティティ抽出を行うマネージド NLP で、自動チューニング対象のモデル開発はできません。
正解:D
正解の根拠
Amazon SageMaker のリアルタイムエンドポイントは、モデルをデプロイすると AWS 側がインスタンスや HTTPS フロントエンド、オートスケーリングまで管理するフルマネージドサービスです。利用者は SDK で推論呼出を行うだけでサーバー管理から解放され、不動産価格予測のような定常的な推論ワークロードを最小運用で運用できます。
デプロイ方式の比較
| 方式 | 運用負荷 |
|---|---|
| SageMaker Endpoint | フルマネージドで最小 |
| EC2 | OS/パッチ管理が必要 |
| EKS | クラスター運用が必要 |
| CloudFront+S3 | 静的配信用で推論不可 |
不正解の理由
- A: EC2 上のデプロイは OS パッチ、スケーリング、推論サーバー管理が利用者責任となり、サーバー管理回避の要件に反します。
- B: EKS クラスター運用には Kubernetes の知識やノード管理が伴い、インフラ管理を避けたい要件に合致しません。
- C: CloudFront と S3 は静的コンテンツ配信向けで、ML モデルの推論実行基盤としては利用できません。
正解:A
正解の根拠
Amazon SageMaker は最新のデータで継続的に再学習・評価・デプロイを反復実行できるフルマネージド ML プラットフォームです。SageMaker Pipelines や Model Monitor を組み合わせれば、データドリフトを検知して自動再学習する MLOps パイプラインを構築でき、食品廃棄予測のように需要動向が変化する用途でモデル精度を継続的に改善できます。
サービスの役割
| サービス | 役割 |
|---|---|
| SageMaker | カスタム学習と継続改善 |
| Personalize | レコメンド専用 |
| CloudWatch | メトリクス/ログ監視 |
| Rekognition | 画像/動画解析 |
不正解の理由
- B: Personalize はレコメンデーション専用で、需要予測モデルの自由な再学習サイクル構築には適しません。
- C: CloudWatch は監視サービスで、ML モデルの構築や精度向上の反復処理は実行できません。
- D: Rekognition は画像・動画解析の API で、需要予測モデルの最適化用途には合致しません。
正解:D
正解の根拠
ML ライフサイクルではビジネス目標の特定フェーズで業務要件と並びコンプライアンスや法規制要件 (GDPR、HIPAA、個人情報保護法など) を整理し、後続の設計に制約として反映します。この段階で要件を明確化することで、データ収集範囲、モデル説明責任、運用ガバナンスまで一貫した設計指針が確立されます。
ML ライフサイクルの主要フェーズ
| フェーズ | 主タスク |
|---|---|
| ビジネス目標特定 | 規制/KPI の整理 |
| データ収集 | ソース/ラベル準備 |
| 特徴量エンジニアリング | 特徴量設計 |
| モデル訓練/評価 | アルゴリズム選定 |
不正解の理由
- A: 特徴量エンジニアリングは説明変数の生成段階であり、規制要件の決定はそれより前段で完了している必要があります。
- B: モデル訓練は要件確定後の技術的工程で、コンプライアンス要件の決定フェーズではありません。
- C: データ収集はビジネス目標で定めた要件に基づき進める下流工程で、規制要件決定の本質的フェーズではありません。
参考:ML Lifecycle
正解:A
正解の根拠
ラベル付き画像が大量にあり、追加ラベリングを行わない条件下では、入力と正解ラベルのペアからパターンを学習する教師あり学習が最適です。画像分類は典型的な教師あり学習タスクで、CNN や事前学習済み Vision Transformer をファインチューニングする SageMaker JumpStart などで効率的にモデルを構築できます。
学習タイプの比較
| 学習タイプ | 用途 |
|---|---|
| 教師あり学習 | ラベル付きデータで分類/回帰 |
| 教師なし学習 | クラスタリングや次元削減 |
| 強化学習 | 報酬最大化の意思決定 |
| アクティブラーニング | 不確実な例を追加ラベル |
不正解の理由
- B: 教師なし学習はラベル無しデータでクラスタリング等を行う手法で、既存のラベルを活用する分類タスクには適しません。
- C: 強化学習は環境との相互作用と報酬から方策を学ぶ手法で、静的な画像分類のパラダイムとは異なります。
- D: アクティブラーニングは新規データへ追加ラベル付けして精度を向上する手法で、追加ラベルを行わない前提に反します。
参考:ML 学習タイプ
