Quy tắc bảo vệ Amazon Bedrock công bố API mới nhắm đến quy trình làm việc AI tác tử
Quy tắc bảo vệ Amazon Bedrock hiện cung cấp API InvokeGuardrailChecks, API không tài nguyên mới cho phép bạn áp dụng các biện pháp bảo vệ riêng lẻ tại bất cứ điểm nào trong các ứng dụng AI tác tử, mà không cần tạo tài nguyên quy tắc bảo vệ. API cung cấp quyền kiểm soát chi tiết theo yêu cầu đối với các biện pháp bảo vệ nào được chạy ở mỗi bước của vòng lặp tác tử, trả về mức độ nghiêm trọng dưới dạng số và điểm đánh giá độ tin cậy để bạn có thể triển khai các ngưỡng và hành động tùy chỉnh, như chặn, cho qua, thử lại hoặc ghi lại dựa trên yêu cầu cụ thể của bạn.
Các ứng dụng AI tác tử hoạt động thông qua các vòng lặp lặp đi lặp lại; lập kế hoạch tác vụ, gọi công cụ, xử lý đầu ra và lặp lại, đồng thời thường thực hiện hàng chục bước cho một yêu cầu duy nhất. Mỗi bước có một hồ sơ rủi ro khác nhau, do đó sẽ khó điều chỉnh quy mô nếu chỉ áp dụng một quy tắc bảo vệ cho tất cả. API InvokeGuardrailChecks giải quyết vấn đề này bằng cách hoạt động ở chế độ chỉ phát hiện, mà không có ID quy tắc bảo vệ để theo dõi và không có phiên bản để quản lý. Bạn sẽ chỉ định các biện pháp bảo vệ nào được chạy trực tiếp trong mỗi yêu cầu, giúp dễ dàng thêm, xóa hoặc điều chỉnh hoạt động kiểm tra khi quy trình công việc phát triển.
API hỗ trợ các bộ lọc nội dung (phát hiện nội dung có hại trên các danh mục bao gồm nội dung thù ghét, bạo lực, khiêu dâm, lăng mạ và hành vi sai trái), phát hiện tấn công bằng câu lệnh (xác định hành vi bẻ khóa, bơm câu lệnh và rò rỉ câu lệnh dưới dạng kiểm tra riêng lẻ độc lập) và bộ lọc thông tin nhạy cảm (phát hiện các loại thực thể PII được hỗ trợ). Phát hiện tấn công bằng câu lệnh được hiển thị như một biện pháp bảo vệ riêng biệt, cung cấp mức độ chi tiết để gọi từng véc-tơ tấn công được hỗ trợ một cách độc lập.
API InvokeGuardrailChecks hiện có sẵn ở các Khu vực AWS sau: Miền Đông Hoa Kỳ (Bắc Virginia), Miền Đông Hoa Kỳ (Ohio), Miền Tây Hoa Kỳ (Oregon), Châu Âu (London), Châu Âu (Stockholm), Châu Á Thái Bình Dương (Tokyo) và Châu Á Thái Bình Dương (Sydney).
Để tìm hiểu thêm, hãy truy cập tài liệu kỹ thuật của Quy tắc bảo vệ Amazon Bedrock.