AIF-C01#39(fundamentals-ai-ml)
ある企業が財務取引記録(トランザクション)を分析しています。この企業は、各記録を「個人用(personal)」または「ビジネス用(business)」のいずれかに分類し、そのカテゴリを取引記録に挿入しています。 これはどのデータ準備ステップを説明していますか?
正解:B
正解の根拠
各取引記録に「個人用」「ビジネス用」のカテゴリを人間が判定して付与する作業はデータラベリング (Data Labeling) です。教師あり学習用の正解ラベルを与える前処理工程で、SageMaker Ground Truth がアノテーション UI とワークフォース機能を提供しています。
データ準備工程の比較
| 工程 | 目的 |
|---|---|
| データラベリング | 教師ラベル付与 |
| データエンコーディング | カテゴリ→数値変換 |
| データ正規化 | スケール統一 |
| データバランシング | クラス分布調整 |
不正解の理由
- A: エンコーディングはカテゴリを数値ベクトルへ変換する処理で、人間が新規ラベルを判断する作業ではありません。
- C: 正規化は数値データを 0〜1 等に揃える前処理で、カテゴリ判定とは目的が異なります。
- D: バランシングはクラス間サンプル数を調整する処理で、ラベルそのものを付与する作業とは別工程です。

コメント