Amazon Bedrock AgentCore がエージェントパフォーマンスを最適化する機能をリリース (プレビュー)

投稿日: 2026年4月30日

Amazon Bedrock AgentCore では、レコメンデーションと、パフォーマンスを検証する 2 つの方法 (バッチ評価と A/B テスト) をリリースしました。これにより、本番環境での AI エージェントの観察、評価、改善という一連のサイクルが完結します。これまでは、評価結果を検証済みの具体的な改善につなげるために、体系的なアプローチではなく、デベロッパーの手動による介入と直感が必要でした。レコメンデーション、バッチ評価、A/B テストにより、デベロッパーは評価によって明らかになった課題に対し、対策を講じるための手段を手に入れることができます。

モデルが進化し、ユーザーの動作が変化するにつれて、エージェントの品質は時間の経過とともに少しずつ低下していきます。レコメンデーション機能では、AgentCore によって生成された本番環境のトレースと評価出力を分析して、特定のワークロードに合わせて最適化されたシステムプロンプトとツール記述を作成します。その後、バッチ評価を使用して、事前に定義されたテストケースに対してレコメンデーションを検証します。A/B テストでは、事前定義されたテストセットや実際の本番トラフィックに使って、制御された A/B テストを行い、そのレコメンデーションをさらに検証します。変更が適用される前に、統計的有意性が報告されます。すべてのレコメンデーションは、リリースされる前にお客様の承認を必要とします。これらの機能を組み合わせることで、エージェントのパフォーマンス改善サイクルが完結します。エージェントは単に実行されるだけではなく、お客様の管理下で改善されていきます。

最適化機能は、AgentCore Evaluations が利用可能なすべての AWS リージョンで使用できます。詳細については、AgentCore のドキュメントをご覧ください。