DP-900-CORE#92
データ ウェアハウス と データ レイク の主な違いとして最も適切なものはどれですか?
解説
【正解: A】の理由
データ ウェアハウス (DWH) は構造化データを SQL でクエリすることに特化したサービスであり、データ レイクは任意形式 (構造化/半構造化/非構造化) を生のまま保存しておくサービスです。
Lakehouse は両者の利点を統合したもので、Delta Lake (Parquet + ACID) によりデータ レイクに DWH 機能を載せます。
【他選択肢が違う理由】
出典: Microsoft Learn — Data lake vs data warehouse
データ ウェアハウス (DWH) は構造化データを SQL でクエリすることに特化したサービスであり、データ レイクは任意形式 (構造化/半構造化/非構造化) を生のまま保存しておくサービスです。
| 観点 | データ ウェアハウス | データ レイク |
|---|---|---|
| データ形式 | 構造化 (列指向) | 任意 |
| スキーマ | Schema-on-Write (書込時強制) | Schema-on-Read (読込時解釈) |
| クエリ言語 | SQL | Spark / SQL / Python / R 等 |
| ストレージ コスト | 高 | 低 |
| 代表 Azure サービス | Synapse Dedicated SQL Pool、Fabric Warehouse | ADLS Gen2、OneLake |
Lakehouse は両者の利点を統合したもので、Delta Lake (Parquet + ACID) によりデータ レイクに DWH 機能を載せます。
【他選択肢が違う理由】
- B. DWH はオンプレ専用、Data Lake はクラウド専用: 事実誤認です。両方ともオンプレ・クラウドの両方に対応します。
- C. DWH は無料、Data Lake は有料: 事実誤認です。両方とも有料サービスとして提供されています。
- D. DWH は Power BI 専用、Data Lake は Excel 専用: 事実誤認です。両方とも複数ツールから接続できます。
出典: Microsoft Learn — Data lake vs data warehouse

コメント