ADP#1(data-pipeline)

ADP#1(data-pipeline)

Dataflowで処理する基本データ構造はどれですか。

ディスカッション 0

正解:B

正解の根拠

Apache BeamではPCollectionが分散データセットの基本単位です。バウンドおよびアンバウンドの両方を扱えます。

構造用途
PCollectionBeamの分散コレクション
PTransform変換処理

不正解の理由

  • DataFrameはpandasやSparkの構造です
  • RDDはSpark固有です
  • TensorはMLフレームワークの構造です

参考:Dataflow ドキュメント


コメント

コメント

コメントする

目次