AIF-C01#19(fundamentals-ai-ml)
ある企業が、内部ソースから得られたペタバイト規模の非構造化データをデータベースに保有しています。この企業は、このデータを構造化形式に変換し、データサイエンティストが機械学習(ML)タスクを実行できるようにしたいと考えています。 この要件を満たすサービスはどれですか?
正解:D
正解の根拠
AWS Glue はサーバーレスの ETL サービスで、Glue クローラーがデータソースのスキーマを推論し、Glue Data Catalog に登録します。Spark ベースの Glue ジョブでペタバイト規模の非構造化データを構造化し、S3 や Redshift、Athena から ML タスクに利用可能な状態にできます。
サービスの役割
| サービス | 役割 |
|---|---|
| Glue | サーバーレス ETL/カタログ |
| Lex | 会話型ボット構築 |
| Rekognition | 画像/動画解析 |
| Kinesis Data Streams | リアルタイム取り込み |
不正解の理由
- A: Lex はチャットボット構築サービスで、非構造化データの構造化変換は機能範囲外です。
- B: Rekognition は画像・動画解析サービスで、テキスト中心のデータ ETL 用途には適合しません。
- C: Kinesis Data Streams はストリーム取り込みサービスで、ペタバイト規模のバッチ ETL には Glue が標準解です。
参考:AWS Glue

コメント