Question#4(Professional Cloud Database Engineer)

Question#4(Professional Cloud Database Engineer)

問題: あなたのチームは、ストリーミングの時系列金融データを保存・分析するアプリケーションを構築しています。以下の要件を満たすデータベースソリューションが必要です。

  • サブ秒のレイテンシで時系列ベースのスキャンを実行できること。

  • 数百テラバイトの規模までスケールできること。

  • 書き込み速度が毎秒 10,000 レコードまで対応できること。

  • 読み取り速度が毎秒 200 MBまで対応できること。

ディスカッション 0

正解:B

この問題の鍵は、提示されたワークロードの特性、特に「ストリーミング時系列データ」「サブ秒の低レイテンシ」「高いスケーラビリティ」「高スループット」をすべて満たす Google Cloud のデータベースを選択することです。

1. 要件の分析とデータベースの適性

要件 特徴 適したデータベース
データタイプ ストリーミング時系列金融データ Bigtable (時系列データに最適化)
レイテンシ サブ秒のレイテンシでのスキャン Bigtable (低レイテンシな読み書きに特化)
スケーラビリティ 数百テラバイト規模 Bigtable (ペタバイト級までシームレスにスケール)
スループット 10k レコード/秒の書き込み、200 MB/秒の読み取り Bigtable (高い I/O スループットを提供)

2. 選択肢の検証

  • A. Firestore (NoSQL ドキュメントデータベース):

    • 適さない点: 数百テラバイトという大規模なデータセットや、毎秒 10,000 レコードという高い書き込みスループットを扱う設計にはなっていません。低レイテンシな単一ドキュメントの操作には優れますが、時系列ベースの大規模なスキャンには適していません。

  • B. Bigtable (NoSQL ワイドカラムデータベース):

    • 最も適切: Bigtable は、ペタバイト級の時系列データ、金融データ、IoT データなどの大規模な分析ワークロードのために構築されたサービスです。

    • 低レイテンシ: 高速なランダムアクセスとキーベースの行スキャンに最適化されており、サブ秒のレイテンシ要件を満たします。

    • 高スループット: 秒間数万〜数十万の読み書きリクエストを処理する高いスケーラビリティとスループットを提供します。

  • C. BigQuery (分析用データウェアハウス):

    • 適さない点: BigQuery は、大規模なデータに対するアドホックな複雑な分析クエリ(OLAP)に優れています。しかし、レイテンシは通常秒単位であり、サブ秒の低レイテンシでのスキャンや、リアルタイムなアプリケーションのトランザクション要件(OLTPに似た要求)には適していません。

  • D. Cloud Spanner (グローバル分散リレーショナルデータベース):

    • 適さない点: Cloud Spanner は、グローバルな分散と強整合性が求められるトランザクション(OLTP)に優れています。しかし、時系列データ超高スループットのランダムアクセスを数百テラバイト規模で扱う場合、費用対効果や設計上の最適性において、Bigtableが明確に有利です。

したがって、大規模な時系列データ高スループットかつ低レイテンシで処理するという要件の組み合わせを満たす唯一のソリューションは Bigtable です。


コメント

コメント

コメントする

目次