AZ900-Architect#108-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある小売業企業が POS データ (日次 100 GB)、Web ログ (日次 50 GB)、CRM (顧客 1,000 万) を統合し、データ分析プラットフォームを構築します。要件は、ペタバイト級のスケーラビリティ、BI チームが SQL で分析、Data Science チームが Python / ML で予測モデル開発、リアルタイム ダッシュボードです。
解決策
Azure Databricks を中核に、Delta Lake で Lakehouse、MLflow で ML ライフサイクル、Power BI 連携を構築する。
この解決策は目的を満たしますか?
解説
【判定: はい】の理由
Databricks も本要件を完全に満たします。Delta Lake で ACID Lakehouse を構築し、Spark の超並列処理でペタバイト級スケール、Databricks SQL Warehouse で BI チームが SQL 分析、Notebooks + MLflow で Data Science チームが Python / Spark ML、Power BI 連携でリアルタイム ダッシュボードを実現できます。
【「いいえ」が違う理由】
Synapse と Databricks は競合かつ補完関係で、ML / Data Science / オープン スタンダードでは Databricks が先進的です。チーム スキルや既存資産で選定するのが実務で、本要件 4 項目はいずれの製品でも満たせるため、Databricks 構成も正解として成立します。

コメント