AI901-Concept#134-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある銀行のコール センターが、過去 2 年分の顧客通話録音 (約 50 万件 / Storage Blob 保存) を分析対象として、書き起こしテキスト + 話者分離 + 感情分析を含む完全な VOC データセットを Azure AI Foundry で構築します。リアルタイム性は不要ですが、処理コストと運用性が論点となります。
解決策
50 万件の音声ファイルそれぞれに対して、リアルタイム STT API を 1 件ずつ同期呼び出しで処理し、結果を 1 件ずつ保存します。batch transcription は使用しません。
この解決策は目的を満たしますか?
解説
【判定: いいえ】の理由
リアルタイム STT API を 50 万件にわたって 1 件ずつ同期呼び出しするのは、コスト・性能・運用の全観点で最悪の設計です。リアルタイム API はストリーミング音声の即時処理に最適化されており、課金単価が高く、レート制限も厳しいため大量バッチ用途には不向きです。batch transcription API は同じ書き起こし結果を非同期 / 一括処理で取得でき、料金体系も batch 向けに最適化されています。さらに同期呼び出しでは並列処理が困難で、50 万件を順次処理すると数週間以上かかる可能性があります。要件 (リアルタイム性不要 / 大量データ / コスト効率) を考慮すれば batch transcription を選ぶのが当然で、本提案は機能選定の根本的な誤りです。
【「はい」が違う理由】
機能的には書き起こしは得られても、コスト / 時間 / 運用性のすべてで破綻し、本番運用に耐えません。「目的を満たす」とは判定できません。
リアルタイム STT API を 50 万件にわたって 1 件ずつ同期呼び出しするのは、コスト・性能・運用の全観点で最悪の設計です。リアルタイム API はストリーミング音声の即時処理に最適化されており、課金単価が高く、レート制限も厳しいため大量バッチ用途には不向きです。batch transcription API は同じ書き起こし結果を非同期 / 一括処理で取得でき、料金体系も batch 向けに最適化されています。さらに同期呼び出しでは並列処理が困難で、50 万件を順次処理すると数週間以上かかる可能性があります。要件 (リアルタイム性不要 / 大量データ / コスト効率) を考慮すれば batch transcription を選ぶのが当然で、本提案は機能選定の根本的な誤りです。
【「はい」が違う理由】
機能的には書き起こしは得られても、コスト / 時間 / 運用性のすべてで破綻し、本番運用に耐えません。「目的を満たす」とは判定できません。

コメント