Amazon Bedrock AgentCore 推出新的最佳化功能,可持續改善正式環境中的代理程式

張貼日期: 2026年6月17日

今天,AWS 宣布 AgentCore 推出新的最佳化功能,可將正式環境追蹤轉化為代理程式的持續改善。最危險的代理程式故障,不是那些會拋出錯誤的故障。而是那些在儀表板上看起來正常的無聲故障。這些故障不會產生錯誤訊號,往往要數週後才會透過客戶舉報浮現。AgentCore 透過一個迴圈來理解代理程式在做什麼、產生以資料為基礎的修正,並證明這些修正有效,從而彌補了這個落差。

為了了解代理程式行為,AgentCore 會在數百個工作階段中呈現故障、意圖和軌跡洞察,揭示出儀表板或逐一追蹤檢閱所無法發現的模式。故障洞察會找出反覆發生的故障模式,包括無聲的行為故障,說明每一種故障的根本原因,並依其普遍程度排序,讓團隊能優先修正影響最多使用者的問題。意圖洞察會依使用者想完成的事情將請求叢集,而軌跡洞察則會將代理程式執行任務時採取的路徑分組,呈現常見模式與離群值。客戶可啟用持續監控,或在幾分鐘內執行目標式調查。為了有信心地修正問題,推薦功能會分析追蹤和評估輸出,根據代理程式的實際行為,對系統提示詞和工具描述提出具體改進建議。每項推薦都包含與觀察到的故障相關聯的明確依據,並可立即驗證;這不是泛泛而談的建議,而是源自正式環境資料的目標式變更。在變更觸及使用者之前,批次評估會針對已定義的測試資料集測試推薦內容,並回報多個評估器的彙總分數,及早發現迴歸。客戶可定義「良好」的標準,而批次評估會大規模衡量每個候選變更是否達到該標準。接著,A/B 測試會透過分割即時正式環境流量,並並排衡量結果,在真實條件下對代理程式版本進行受控比較,以確認改進是否持續有效。這可在客戶承諾將變更擴展到整個機群之前,提供統計證據,證明該變更確實在正式環境中有效,而不只是對測試資料有效。無論代理程式在哪裡執行,這些功能都可運作:AgentCore 的執行時期、AWS Lambda、Amazon EKS 或非 AWS 環境。

故障、意圖和軌跡洞察現已於 13 個 AWS 區域提供預覽。 批次評估、推薦和 A/B 測試現已於 14 個 AWS 區域正式推出。若要了解詳情,請造訪 Amazon Bedrock AgentCore 或參閱文件