ある企業は、機械学習(ML)を使用して顧客離反予測モデルを改善しようとしています。企業はデータをAmazon Redshiftデータウェアハウスに保存しています。データサイエンスチームは、Amazon Redshift機械学習(Amazon Redshift ML)を使用して、データウェアハウス内で直接モデルを構築し、新しいデータに対する予測を実行したいと考えています。Amazon Redshift MLを使用してこれらの要件を満たすために、企業はどのステップの組み合わせを実行すべきですか?(3つ選択)
(3つ選択)
正解:A, C, E
(特徴量変数とターゲット変数を定義)は、モデル構築の最初のステップとして不可欠です。Redshift MLでは、トレーニングデータの特徴量(例:顧客の年齢、購入頻度、契約期間)とターゲット変数(例:離反したかどうか)をSQLクエリで指定する必要があります。これにより、モデルがどのデータを入力として使用し、どの結果を予測するかを定義できます。
(CREATE MODEL SQLステートメントを記述してモデルを作成)は、Redshift MLの中心的なプロセスです。Redshift MLでは、CREATE MODELステートメントを使用して、トレーニングデータの選択、モデルタイプ(例:2値分類)、ハイパーパラメータ、ターゲット変数を指定し、モデルをトレーニングします。Redshift MLは内部的にAmazon SageMakerを利用してモデルをトレーニングし、トレーニング済みモデルをRedshift内に保存するため、データサイエンティストはSQLだけでモデル構築を完結できます。
(SQL予測関数を使用して予測を実行)は、新しいデータに対する予測を行うためのステップです。Redshift MLでは、トレーニング後に生成された予測関数(例:モデル名に基づくカスタム関数)を使用して、SQLクエリで新しいデータに対して予測を実行できます。これにより、データウェアハウス内で直接、離反確率を予測でき、外部ツールやデータ移動が不要です。

コメント