AIF-C01#19(fundamentals-ai-ml)

AIF-C01#19(fundamentals-ai-ml)
ある企業が、内部ソースから得られたペタバイト規模の非構造化データをデータベースに保有しています。この企業は、このデータを構造化形式に変換し、データサイエンティストが機械学習(ML)タスクを実行できるようにしたいと考えています。 この要件を満たすサービスはどれですか?

正解:D

正解の根拠

AWS Glue はサーバーレスの ETL サービスで、Glue クローラーがデータソースのスキーマを推論し、Glue Data Catalog に登録します。Spark ベースの Glue ジョブでペタバイト規模の非構造化データを構造化し、S3 や Redshift、Athena から ML タスクに利用可能な状態にできます。

サービスの役割

サービス役割
Glueサーバーレス ETL/カタログ
Lex会話型ボット構築
Rekognition画像/動画解析
Kinesis Data Streamsリアルタイム取り込み

不正解の理由

  • A: Lex はチャットボット構築サービスで、非構造化データの構造化変換は機能範囲外です。
  • B: Rekognition は画像・動画解析サービスで、テキスト中心のデータ ETL 用途には適合しません。
  • C: Kinesis Data Streams はストリーム取り込みサービスで、ペタバイト規模のバッチ ETL には Glue が標準解です。

参考:AWS Glue


コメント

コメント

コメントする

目次