Amazon Bedrock が Service Quotas のサポートを拡大

投稿日: 2026年5月27日

Amazon Bedrock は完全マネージド型サービスで、大手の AI 企業が提供する高性能な基盤モデルへのセキュアなエンタープライズグレードのアクセスを提供し、生成 AI アプリケーションの構築とスケールを可能にします。Amazon Bedrock のお客様は、AWS Service Quotas を使って bedrock-mantle エンドポイントの推論クォータを確認できるようになりました。これにより、bedrock-runtime エンドポイントや AWS のその他のサービスと同様の使い慣れた一貫した方法でこのエンドポイントの制限を追跡でき、自身のワークロードに適用される制限を明確に把握できます。

bedrock-mantle エンドポイントは、OpenAI Responses API、OpenAI Chat Completions API、Anthropic Messages API をサポートしているため、最小限のコード変更で既存の OpenAI または Anthropic ベースのアプリケーションを Amazon Bedrock で実行できます。AWS Service Quotas では、エンドポイントでサポートされているモデルについて、input-tokens-per-minute および output-tokens-per-minute クォータをモデルごとに公開するようになりました。

今回の発表により、お客様は bedrock-mantle エンドポイントにどれだけの制限があるかを把握し、本番環境のスケールを事前に計画できるようになります。使用を開始するには、AWS Service Quotas コンソールを開いて Amazon Bedrock を選択し、「Bedrock Mantle」を検索して現在のクォータを表示します。これらのクォータの引き上げをリクエストするには、標準の Amazon Bedrock 制限引き上げプロセスに従ってください。bedrock-mantle エンドポイントの Service Quotas サポートは、エンドポイントが提供されているすべての AWS リージョンで利用できます。つまり、米国東部 (バージニア北部、オハイオ)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ、東京、シドニー、ジャカルタ)、欧州 (フランクフルト、アイルランド、ロンドン、ミラノ、ストックホルム)、南米 (サンパウロ) です。詳細については、Amazon Bedrock のクォータを参照してください。