DP-900-CORE#98-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある小売チェーンが、各店舗 POS から日次集計データを集めて月次売上分析を行いたいです。データ量はそれほど多くなく (1 日 10MB 程度)、業務部門のアナリストが Excel に慣れており、SQL 経験は限定的です。
解決策
Azure Synapse Dedicated SQL Pool (専用容量 DW100c 以上) を構築し、各 POS データを Synapse Pipelines でロード、Spark Notebook で集計、結果を Synapse SQL に保存して BI に接続する。
この解決策は目的を満たしますか?
解説
【判定: いいえ】の理由
本提案はオーバー エンジニアリングであり、データ量とユーザー スキルの両面で要件に合致しません。
規模選定のセオリーとして、データ量 (< 1GB / < 100GB / TB-PB) と業務ユーザーのスキルに応じて、Power BI / SQL Database / Synapse を使い分ける必要があります。
【「はい」が違う理由】
Synapse Dedicated SQL Pool は数 TB〜PB 級の DWH 用途を想定したサービスであり、小規模 (10MB/日) + Excel に慣れたアナリストには明らかに過剰でコスト・スキル両面で破綻します。
出典: Microsoft Learn — Choose the right Azure analytics service
本提案はオーバー エンジニアリングであり、データ量とユーザー スキルの両面で要件に合致しません。
| 問題 | 詳細 |
|---|---|
| コスト過大 | Synapse Dedicated SQL Pool (DW100c) は最小でも月数十万円であり、日 10MB のデータには明らかに過剰です |
| スキル ミスマッチ | Spark Notebook (Python/Scala) + T-SQL DW は Excel 経験のアナリストでは扱えません |
| 複雑な運用 | Synapse + Pipelines + Spark を構築・運用するデータ エンジニア チームが必要になります |
| 時間コスト | 単純な月次集計に 1 ヶ月以上の構築期間がかかります |
規模選定のセオリーとして、データ量 (< 1GB / < 100GB / TB-PB) と業務ユーザーのスキルに応じて、Power BI / SQL Database / Synapse を使い分ける必要があります。
【「はい」が違う理由】
Synapse Dedicated SQL Pool は数 TB〜PB 級の DWH 用途を想定したサービスであり、小規模 (10MB/日) + Excel に慣れたアナリストには明らかに過剰でコスト・スキル両面で破綻します。
出典: Microsoft Learn — Choose the right Azure analytics service

コメント