ある会社は、オンプレミスで画像データを解析・保存するアプリケーションを運用しています。毎日数百万件の新しい画像ファイル(平均 1 MB)が到着し、アプリケーションは 1 GB 単位でバッチ解析を行います。解析時に画像をまとめて ZIP 化し、長期保存のためにオンプレミスの NFS サーバーに単一ファイルとしてアーカイブしています。オンプレミスには Microsoft Hyper-V 環境があり計算リソースは空いていますが、ストレージ空きはありません。アーカイブ先を AWS にしたく、リクエストから 1 週間以内にアーカイブデータを取り出せることが必要です。オンプレミスと AWS の間には 10 Gbps の AWS Direct Connect 接続があります。業務時間外にのみアーカイブを AWS へコピーしたいのでスケジュール設定が必要であり、同時に帯域の上限も設定したい要件があります。最もコスト効率よく要件を満たすソリューションはどれですか。
正解:B
本件では長期保管のための最安ストレージと、業務時間外に限定した転送スケジュールと帯域制御が鍵になります。S3 のアーカイブ階層のうち S3 Glacier Deep Archive は TB 規模の長期保管で最も低コストであり、標準取り出しが 12 時間程度(バルクでも 48 時間)で完了するため「1 週間以内に取り出し可能」という要件を余裕で満たします。AWS DataSync はオンプレミスの NFS をソースにして S3 をターゲットにでき、**タスクのスケジュール(cron 式)と帯域上限(Bytes/秒)**をタスクオプションで設定できます。会社には Hyper-V 環境があるので、エージェントはオンプレミスの Hyper-V にデプロイするのが自然で追加の EC2 コストも不要です。したがって、NFS→S3 Glacier Deep Archive を DataSync(スケジュール・帯域制限つき)で直接転送する B が最もコスト効率よく、運用も単純で、取り出し要件も満たします。

コメント