Question#42(MLS-C01)
自動車会社は複数の都市に販売店を展開しています。同社は、顧客に自動車をマーケティングするために機械学習(ML)推薦システムを使用しています。MLエンジニアは、自動車ごとの複数の属性を含むデータセットでML推薦モデルをトレーニングしました。データセットには、自動車のブランド、車種、燃費、価格などの属性が含まれています。MLエンジニアは、Amazon SageMaker Data Wranglerを使用してデータを分析および可視化しています。MLエンジニアは、特定の車種の価格分布を特定する必要があります。これらの要件を満たすために、MLエンジニアはどの種類の可視化を使用すべきですか?
正解:D
SageMaker Data Wranglerのヒストグラム可視化を使用して、特定の車種の価格分布を特定することは、要件に最適です。ヒストグラムは、価格のような連続値の特徴量の分布を可視化し、値の範囲、頻度、分布形状(例:正規分布、偏った分布)を直感的に理解できます。Data Wranglerでは、特定の車種(カテゴリカル変数)にフィルタリングした後、価格のヒストグラムを生成する操作が簡単で、ビジュアルインターフェースを通じて迅速に実行できます。このアプローチは、コードを書かずに分析を行えるため、MLエンジニアの負担を軽減し、データ分析の初期段階で価格分布を効率的に特定できます。したがって、選択肢4は、特定の車種の価格分布を特定するという要件を最も直接的かつ効果的に満たします。

コメント