Amazon Bedrock Guardrails がエージェンティック AI ワークフローを対象とした新しい API を発表

投稿日: 2026年6月16日

Amazon Bedrock Guardrails は、InvokeGuardrailChecks API の提供を開始しました。これは、ガードレールリソースを作成することなく、エージェンティック AI アプリケーションの任意の時点で個別のセーフガードを適用できる、新しいリソースレス API です。この API は、エージェントループの各ステップで実行するセーフガードをリクエストごとに細かく制御し、重大度スコアと信頼度スコアを数値で返します。これにより、特定の要件に基づいてブロック、合格、再試行、ログ記録のいずれを行うかなど、カスタムのしきい値やアクションを実装できます。

エージェンティック AI アプリケーションは、タスクの計画、ツールの呼び出し、出力の処理、再度の繰り返しといった反復ループによって動作します。多くの場合、1 つのリクエストに対して何十ものステップを実行します。ステップごとにリスクプロファイルが異なるため、万能型のガードレールをスケールすることは困難です。InvokeGuardrailChecks API は、追跡するガードレール ID や管理するバージョンがない検出専用モードで動作することで、この課題に対処します。リクエストごとに実行するセーフガードを直接指定するため、ワークフローの進化に合わせてチェックの追加、削除、調整を簡単に行うことができます。

この API は、コンテンツフィルター (憎悪、暴力、性的、侮辱、不正行為などのカテゴリーにわたる有害なコンテンツを検出)、プロンプト攻撃検出 (ジェイルブレイク、プロンプトインジェクション、プロンプト漏洩を独立したスタンドアロンチェックとして識別)、機密情報フィルター (サポートされている PII エンティティタイプを検出) をサポートしています。プロンプト攻撃検出は個別のセーフガードとして公開されているため、サポートされている各攻撃ベクトルを個別にきめ細く呼び出すことができます。

現在、InvokeGuardrailChecks API は、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (ロンドン)、欧州 (ストックホルム)、アジアパシフィック (東京)、アジアパシフィック (シドニー) の AWS リージョンで利用できます。

詳細については、Amazon Bedrock Guardrails のテクニカルドキュメントをご覧ください。