Question#32(DP-100)
【注意】この問題はシリーズ問題の一部です。各問題には目標を満たす可能性のある固有の解決策が含まれています。このセクションで問題に回答した後は戻れません。
Python スクリプトを含む 2 つのステップを持つ pipeline1 という名前の Azure Machine Learning パイプラインを作成しました。最初のステップで処理されたデータは 2 番目のステップに渡されます。
pipeline1 のダウンストリームのデータ ソースの内容を更新して、パイプラインを再実行する必要があります。
pipeline1 の新しい実行で更新された内容が完全に処理されるようにする必要があります。
【解決策】
・pipeline1 実験の run submit メソッドの regenerate_outputs パラメーターを True に設定する。
この解決策は目標を満たしていますか?
正解:A
Experiment.submit() の regenerate_outputs=True を指定すると、パイプライン全体のすべてのステップに対してキャッシュが無効化され、すべてのステップが強制的に再実行されます。 これにより更新されたダウンストリームのデータ ソースが最初のステップで処理され、その出力が 2 番目のステップにも正しく渡されます。 パイプライン レベルでキャッシュを無効化する方法であり、目標を満たしています
コメント