WEB問題集
解説
【正解: A】の理由
Azure Synapse Analytics はデータ統合 (Pipeline)、Dedicated SQL Pool による MPP DWH、Serverless SQL Pool、Apache Spark Pool、Power BI 連携を 1 つのワークスペースに統合した分析プラットフォームです。Microsoft Fabric の中核コンポーネントとして Lakehouse アーキテクチャの基盤を担います。
【他選択肢が違う理由】
- B. Web ホスティング: Web アプリ ホスティングは Azure App Service の領域で、Synapse は分析特化のサービスです
- C. RDB の単純代替: Synapse は分析特化の MPP DWH で、OLTP 用途には Azure SQL Database が適切です
- D. 未サポート: Synapse は Azure の主力分析サービスとして提供され、Fabric として進化しています
解説
【正解: A】の理由
Azure Data Factory はクラウド ネイティブな ETL / ELT サービスで、100+ コネクタで SQL Server / Oracle / SAP / Salesforce / 各クラウド ストレージ等からデータを取り込み、Pipeline と Data Flow で変換 / ロードを宣言的に構築できます。GitHub / DevOps 連携で CI/CD にも対応します。
【他選択肢が違う理由】
- B. 物理工場管理: Data Factory はクラウド データ統合サービスで、製造業の工場管理とは無関係です
- C. RDB 作成: DB プロビジョニングは Azure SQL Database の領域で、Data Factory はデータ統合に特化します
- D. Web アプリ デプロイ: アプリ デプロイは App Service / DevOps の領域で、Data Factory とは別カテゴリです
解説
【正解: A】の理由
Azure Databricks は Databricks 社と Microsoft が共同提供するマネージド Apache Spark プラットフォームで、Delta Lake による ACID Lakehouse、Unity Catalog によるガバナンス、MLflow による ML ライフサイクル管理、共同編集 Notebooks を統合提供します。ML / Data Science / Spark エコシステムで広く利用されます。
【他選択肢が違う理由】
- B. 物理サーバ組立: Databricks はクラウド マネージド サービスで物理ハードウェアの組立は対象外です
- C. RDB のみ: Databricks は非構造化 / 半構造化 / 構造化データすべてを扱い、RDB 専用ではありません
- D. Spark 非互換: Databricks は Apache Spark のリファレンス実装の 1 つで Spark エコシステムと完全互換です
解説
【判定: はい】の理由
Synapse Analytics は本要件すべてを 1 つのワークスペースで満たせます。Dedicated SQL Pool が MPP でペタバイト級スケール、Serverless SQL Pool で BI チームが T-SQL 分析、Spark Pool で Data Science チームが Python / ML を実行、Power BI 統合でリアルタイム ダッシュボードを構築できます。
【「いいえ」が違う理由】
Synapse は BI / Data Science / リアルタイム分析が同居する統合プラットフォームで、データ コピーや ETL の重複を削減できます。Microsoft Fabric の中核として進化を続けており、小売業の典型的なデータ分析基盤として広く採用されているため、要件を満たさないとは言えません。
解説
【判定: はい】の理由
Databricks も本要件を完全に満たします。Delta Lake で ACID Lakehouse を構築し、Spark の超並列処理でペタバイト級スケール、Databricks SQL Warehouse で BI チームが SQL 分析、Notebooks + MLflow で Data Science チームが Python / Spark ML、Power BI 連携でリアルタイム ダッシュボードを実現できます。
【「いいえ」が違う理由】
Synapse と Databricks は競合かつ補完関係で、ML / Data Science / オープン スタンダードでは Databricks が先進的です。チーム スキルや既存資産で選定するのが実務で、本要件 4 項目はいずれの製品でも満たせるため、Databricks 構成も正解として成立します。
解説
【判定: いいえ】の理由
Azure SQL Database は OLTP 用途のリレーショナル DB で、Hyperscale でも最大 100 TB が上限です。ペタバイト級スケールには不足し、大規模集計クエリも DWH 専用設計の Synapse / Databricks に大きく劣ります。Python / Spark ML のネイティブ サポートもありません。
【「はい」が違う理由】
OLTP は SQL Database、分析は Synapse / Databricks と用途別に DB を選定する Polyglot Persistence が原則です。Data Factory で OLTP から分析基盤へ ETL し、分析側で BI / ML / 可視化を実行するのが現代的アーキテクチャで、SQL Database 単独構成では本要件を満たせません。
解説
【正解: A】の理由
Azure HDInsight は Apache Hadoop / Spark / Kafka / HBase / Hive / Storm 等のオープン ソース ビッグデータ フレームワークを Azure 上のマネージド クラスタで実行できるサービスです。オンプレ Hadoop の Lift & Shift や、特定 OSS スタックを利用したいシナリオで有効です。
【他選択肢が違う理由】
- B. RDB 代替: HDInsight はビッグデータ向けで OLTP 用途には適さず、RDB は Azure SQL Database の領域です
- C. 物理組立: HDInsight はマネージド クラウド サービスで、物理ハードウェアの組立とは無関係です
- D. 未サポート: HDInsight は Azure の歴史ある分析サービスとして継続提供されています
解説
【正解: A, B】の理由
(A) Azure Synapse Analytics はデータ統合 / DWH / Spark / BI を統合した分析プラットフォームで、Microsoft Fabric の中核として進化しています。(B) Azure Data Factory は 100+ コネクタを備えるクラウド ネイティブな ETL / ELT サービスで、Pipeline と Data Flow による宣言的なデータ統合を実現します。
【他選択肢が違う理由】
- C. Microsoft Excel: Office 製品の表計算ソフトで、Azure の分析プラットフォーム サービスではありません
- D. Azure DNS: 名前解決サービスで、分析 / データ プラットフォームとは別カテゴリです
- E. Microsoft Word: Office の文書作成ソフトで、Azure 分析サービスとは無関係です
次の各ステートメントについて、Azure 分析 / データ サービスに関する記述として正しい場合は「はい」、誤っている場合は「いいえ」を選択してください。
注: 正解 1 つにつき 1 点が与えられます。
| ステートメント | はい | いいえ |
|---|---|---|
Azure Synapse Analytics は データ統合 / DWH / Spark / Power BI 連携を 1 つのワークスペースに統合する。 正しいです。Synapse はデータ統合 Pipeline、Dedicated / Serverless SQL Pool による DWH、Spark Pool、Power BI 統合を 1 つのワークスペースに集約した分析プラットフォームで、Microsoft Fabric の中核として進化しています。 | ||
Azure Data Factory は 100+ のコネクタで多様なデータ ソース (SaaS / オンプレ / クラウド) を統合できる。 正しいです。Data Factory は SQL Server / Oracle / SAP / Salesforce / Dynamics 365 / 各クラウド ストレージ等 100+ コネクタを備え、Pipeline と Data Flow で宣言的にデータ取り込み / 変換を構成できます。Trigger による自動実行にも対応します。 | ||
Azure Databricks は Microsoft 独自の Spark 互換 / 代替プラットフォームで、Apache Spark エコシステムとは互換性がない。 誤りです。Databricks は Apache Spark の創始者 Databricks 社と Microsoft が共同提供するマネージド プラットフォームで、Delta Lake / MLflow 等 Spark エコシステムと完全互換です。独自代替ではなく、Spark のリファレンス実装の 1 つです。 |
モダン データ プラットフォームの標準的なデータ パイプライン構築の順序に並べ替えてください。
- Ingest (取り込み): Data Factory / Synapse Pipeline で多様なソース (DB / SaaS / IoT / ログ) からデータ レイクへ取り込み
- Transform (変換): Spark / Data Flow / Mapping Data Flow で正規化 / クレンジング / エンリッチメント
- Serve (提供): Dedicated SQL Pool / Synapse Serverless / Databricks SQL で分析向けにモデリング
- Visualize (可視化): Power BI / Tableau / Excel でダッシュボード / レポート / ML モデル予測結果を可視化
解説
【正しい順序: Ingest → Transform → Serve → Visualize】の理由
モダン データ プラットフォームでは Medallion アーキテクチャに沿って段階的に処理を進めます。Step 1 Ingest では Data Factory / Synapse Pipeline が 100+ コネクタで OLTP / SaaS / IoT / ログから Data Lake へ生データを取り込みます。Step 2 Transform では Spark / Data Flow で正規化 / クレンジング / エンリッチメントを実施し分析しやすい形に整えます。Step 3 Serve では Dedicated SQL Pool / Databricks SQL でディメンショナル モデリングや集計マートを構築し BI から高速アクセスできる形に最適化します。Step 4 Visualize では Power BI / Tableau がダッシュボードや ML 予測結果を可視化し意思決定に活用されます。
