DP-900-CORE#84
Avro ファイル形式の特徴として最も適切なものはどれですか?
解説
【正解: B】の理由
Apache Avro は行指向のバイナリ形式であり、JSON ベースのスキーマ情報をファイル内に内包してスキーマ進化 (Schema Evolution) に強いことが特徴です。Apache Kafka / Azure Event Hubs のメッセージ シリアライズ標準としても採用されています。
分析 (集計・列選択) には Parquet、イベント ストリームには Avro という使い分けが一般的です。Fabric Eventstream でも内部で Avro を使用しています。
【他選択肢が違う理由】
出典: Microsoft Learn — File formats in Azure Synapse
Apache Avro は行指向のバイナリ形式であり、JSON ベースのスキーマ情報をファイル内に内包してスキーマ進化 (Schema Evolution) に強いことが特徴です。Apache Kafka / Azure Event Hubs のメッセージ シリアライズ標準としても採用されています。
| 形式 | レイアウト | スキーマ情報 | 主用途 |
|---|---|---|---|
| Parquet | 列指向 | 内包 | 分析クエリ |
| Avro | 行指向 (バイナリ) | 内包 (JSON スキーマ) | メッセージング / イベント ストリーミング |
| ORC | 列指向 | 内包 | Hive / Hadoop 系分析 |
| CSV | 行指向 (テキスト) | なし | 単純エクスポート |
分析 (集計・列選択) には Parquet、イベント ストリームには Avro という使い分けが一般的です。Fabric Eventstream でも内部で Avro を使用しています。
【他選択肢が違う理由】
- A. 列指向、分析クエリに最適化: これは Parquet / ORC の特徴であり、Avro は行指向です。
- C. テキスト形式、人間が直接編集可: これは CSV / JSON / XML の特徴であり、Avro はバイナリ形式です。
- D. Power BI 専用バイナリ: Power BI に Avro 専用機能はなく、Avro はオープン スタンダードです。
出典: Microsoft Learn — File formats in Azure Synapse

コメント