AWS 認定データエンジニア – アソシエイト WEB問題集

WEB問題集

Question#1(DEA-C01)
データエンジニアがAWS Glueジョブを設定してAmazon S3バケットからデータを読み込もうとしています。AWS Glue接続の詳細と関連するIAMロールを正しく設定しました。しかし、ジョブを実行しようとすると「Amazon S3 VPCゲートウェイエンドポイント」に関連するエラーメッセージが表示されます。 このエラーを解決し、AWS GlueジョブをS3バケットに接続するにはどうすればよいですか?
ディスカッション 0

正解:D

エラーメッセージが「Amazon S3 VPCゲートウェイエンドポイント」に関連していることから、VPCのルートテーブルに適切なルートが設定されていないことが原因です。VPCゲートウェイエンドポイントがS3へアクセスするためには、ルートテーブルにエンドポイントのルートを追加する必要があります。 AWS GlueジョブがAmazon S3とVPC内で通信する場合、以下が重要です: VPCゲートウェイエンドポイントが正しく設定されていること。 VPCのルートテーブルにS3エンドポイントへのルートが含まれていること。 NATゲートウェイまたはインターネットゲートウェイが不要な場合、S3への直接ルートが必須です。
Question#2(DEA-C01)
ある小売企業は、Amazon S3バケットに顧客データハブを保持しています。多くの国にいる従業員がこのデータハブを利用して、会社全体の分析を支援しています。ガバナンスチームは、会社のデータアナリストが自国の顧客データのみアクセスできるようにする必要があります。 最小限の運用負担でこの要件を満たすソリューションはどれですか?
ディスカッション 0

正解:B

AWS Lake Formationは行レベルセキュリティをサポートしており、データを1つのテーブルやS3バケットに保持しながら、特定の行のみアクセスを許可することが可能です。この機能により、運用負担を最小限にしつつ、ガバナンス要件を満たせます。 AWS Lake Formationは以下の理由で最適なソリューションです: 行レベルセキュリティ機能を使用して、アナリストごとに特定の行(顧客データ)へのアクセスを制限できる。 データを1か所(S3バケット)に集中管理しつつ、アクセス制御を行えるため、運用がシンプルになる。 最小限の運用負担で、データガバナンスの要件を満たすことが可能。
Question#3(DEA-C01)
あるメディア企業は、ユーザーの行動や好みに基づいてコンテンツを推薦するシステムを改善しようとしています。システム改善のために、サードパーティのデータセットから得たインサイトを、既存の分析プラットフォームに取り入れる必要があります。同時に、サードパーティデータセットの組み込みにかかる労力と時間を最小限にする必要があります。 この要件を最小限の運用負担で満たすソリューションはどれですか?
ディスカッション 0

正解:A

AWS Data Exchangeは、サードパーティのデータセットを容易に検索し、サブスクライブし、APIコールを通じてアクセスできるサービスです。企業はAWS Data Exchangeを利用することで、労力を最小限に抑えつつ、サードパーティデータセットを統合できます。このサービスは特にデータの流通・統合を迅速に行う目的で設計されています。 AWS Data Exchangeは、サードパーティデータの発見、購読、アクセスを容易にするために設計されたサービスです。APIを利用して効率的にデータ統合ができ、運用負担が少ないため、今回の要件に最適です。 最小限の労力でデータ統合を実現し、第三者データを分析プラットフォームに取り込むシナリオに最も適しています。
Question#4(DEA-C01)
ある金融企業がデータメッシュアーキテクチャを実装しようとしています。データメッシュは、集中型のデータガバナンス、データ分析、およびデータアクセス制御をサポートする必要があります。同社はAWS Glueを使用してデータカタログとETL操作を行うことを決定しました。 データメッシュを実装するために必要なAWSサービスの組み合わせはどれですか?(2つ選択)

(2つ選択)

ディスカッション 0

正解:B, E

Amazon S3 はスケーラブルなデータストレージとして最適であり、データメッシュアーキテクチャで頻繁に使用されます。また、Amazon Athena はS3データに対するサーバーレスなSQLクエリをサポートしており、データ分析のための運用負担を大幅に削減します。 AWS Lake Formation は集中型のデータガバナンスおよびアクセス制御をサポートします。データレイクの管理、アクセス権の設定、データセキュリティを一元管理できるため、データメッシュアーキテクチャに最適です。
Question#5(DEA-C01)
データエンジニアが複数のAWS Lambda関数で使用されるカスタムPythonスクリプトを管理しています。Pythonスクリプトを変更するたびに、エンジニアはすべてのLambda関数を手動で更新しなければなりません。エンジニアはLambda関数の更新を手動で行わない方法を求めています。 この要件を満たすソリューションはどれですか?
ディスカッション 0

正解:B

Lambdaレイヤーは複数のLambda関数で共通のライブラリやカスタムコードを共有できる機能です。スクリプトをLambdaレイヤーにパッケージ化し、Lambda関数にそのレイヤーを適用すれば、スクリプトを更新する際にレイヤーのみを更新すればよく、すべてのLambda関数に自動的に変更が反映されます。これにより手動作業が最小限になります。