Amazon Bedrock AgentCore giới thiệu các khả năng tối ưu hóa mới nhằm liên tục cải thiện các tác tử trong môi trường sản xuất
Hôm nay, AWS công bố các khả năng tối ưu hóa mới trong AgentCore, cho phép biến các dấu vết sản xuất thành sự cải thiện liên tục cho các tác tử. Những lỗi nguy hiểm nhất của tác tử không phải là những lỗi gây ra thông báo lỗi. Đó là những lỗi âm thầm, trông thì vẫn ổn trên bảng thông tin. Những lỗi này không tạo ra bất kỳ tín hiệu lỗi nào và thường chỉ lộ ra thông qua khiếu nại của khách hàng sau nhiều tuần. AgentCore thu hẹp khoảng cách đó bằng một vòng lặp để hiểu tác tử đang làm gì, tạo ra các bản sửa lỗi được đặt trên nền tảng dữ liệu, và chứng minh rằng các bản sửa đó thực sự hiệu quả.
Để hiểu hành vi của tác tử, AgentCore hiển thị thông tin chuyên sâu về lỗi, ý định và quỹ đạo thực thi trên hàng trăm phiên, từ đó cho phép phát hiện các mẫu hành vi mà không bảng thông tin nào hay việc đánh giá từng dấu vết riêng lẻ có thể nhận ra. Các thông tin chuyên sâu về lỗi giúp phát hiện các mẫu lỗi lặp lại, bao gồm cả các lỗi hành vi âm thầm, giải thích nguyên nhân gốc rễ của từng lỗi và xếp hạng chúng theo mức độ lan rộng, để các đội ngũ có thể ưu tiên sửa những vấn đề gây ảnh hưởng đến nhiều người dùng nhất trước tiên. Các thông tin chuyên sâu về ý định sẽ phân cụm các yêu cầu theo những gì mà người dùng đang cố gắng thực hiện, còn thông tin chuyên sâu về quỹ đạo thực thi sẽ phân nhóm các đường dẫn mà tác tử đi qua trong một tác vụ, từ đó làm lộ ra các mẫu hành vi phổ biến và các trường hợp ngoại lệ. Khách hàng có thể bật giám sát liên tục hoặc thực hiện điều tra có mục tiêu chỉ trong vài phút. Để khắc phục vấn đề một cách tự tin, các đề xuất sẽ phân tích dấu vết và kết quả đánh giá để gợi ý các cải thiện cụ thể cho câu lệnh hệ thống và mô tả công cụ, và các đề xuất này đều được đặt trên nền tảng hành vi thực tế của tác tử. Mỗi đề xuất đều bao gồm một lý do rõ ràng, gắn với các lỗi quan sát được và sẵn sàng để xác thực, không phải là một gợi ý chung mà là một thay đổi có mục tiêu, được suy ra từ dữ liệu sản xuất. Trước khi một thay đổi đến tay người dùng, đánh giá hàng loạt sẽ kiểm thử các đề xuất trên một tập dữ liệu kiểm thử đã xác định và báo cáo điểm tổng hợp từ nhiều trình đánh giá, từ đó giúp phát hiện sớm các hồi quy. Khách hàng xác định thế nào là "tốt", và đánh giá hàng loạt sẽ đo lường từng thay đổi tiềm năng dựa trên tiêu chuẩn đó ở quy mô lớn. Kiểm thử A/B sau đó sẽ xác nhận rằng các cải thiện được duy trì trong điều kiện thực tế, bằng cách chạy một so sánh có kiểm soát giữa các phiên bản tác tử thông qua việc chia lưu lượng sản xuất thực tế và đo lường kết quả song song. Điều này cung cấp bằng chứng thống kê rằng một thay đổi thực sự hiệu quả trong môi trường sản xuất, không chỉ trên dữ liệu kiểm thử, trước khi khách hàng quyết định triển khai trên toàn bộ nhóm. Các khả năng này hoạt động bất kể tác tử chạy ở đâu: trên Runtime AgentCore, AWS Lambda, Amazon EKS, hoặc các môi trường không thuộc AWS.
Các thông tin chuyên sâu về lỗi, ý định và quỹ đạo thực thi hiện được cung cấp dưới dạng xem trước tại 13 Khu vực AWS. Đánh giá hàng loạt, đề xuất và kiểm thử A/B hiện được cung cấp rộng rãi tại 14 Khu vực AWS. Để tìm hiểu thêm, hãy truy cập Amazon Bedrock AgentCore hoặc tìm hiểu tài liệu.