ADP#1(data-pipeline)
Dataflowで処理する基本データ構造はどれですか。
正解:B
正解の根拠
Apache BeamではPCollectionが分散データセットの基本単位です。バウンドおよびアンバウンドの両方を扱えます。
| 構造 | 用途 |
|---|---|
| PCollection | Beamの分散コレクション |
| PTransform | 変換処理 |
不正解の理由
- DataFrameはpandasやSparkの構造です
- RDDはSpark固有です
- TensorはMLフレームワークの構造です

コメント