Amazon Bedrock AgentCore, üretimdeki temsilcileri sürekli iyileştirmek için yeni optimizasyon özellikleri sunuyor
Bugün AWS, AgentCore'da üretim izlerini temsilciler için sürekli iyileştirmeye dönüştüren yeni optimizasyon özelliklerini duyurdu. En tehlikeli temsilci arızaları, hata verenler değildir. Gösterge panellerinde normal görünen sessiz olanlardır. Bu arızalar hata sinyali vermez ve genellikle haftalar sonra müşteri şikayetleri ile beraber ortaya çıkar. AgentCore, temsilcilerin ne yaptığını anlamak, verilere dayalı düzeltmeler oluşturmak ve çalıştıklarını kanıtlamak için bu boşluğu bir döngü ile kapatır.
AgentCore, temsilci davranışını anlamak için yüzlerce oturumda hata, niyet ve gidişat öngörülerini ortaya çıkararak hiçbir panonun veya tek seferde izleme incelemesinin yakalayamayacağı düzenleri ortaya çıkarır. Başarısızlık öngörüleri, ekiplerin en çok kullanıcıya zarar veren sorunları ilk önce çözmesi için sessiz davranışsal hatalar da dahil olmak üzere yinelenen hata kalıplarını keşfeder, her birinin temel nedenini açıklar ve bunları ne kadar yaygın olduklarına göre sıralar. Niyet öngörüleri, kullanıcıların yapmaya çalıştıklarına göre istekleri kümeler ve gidişat öngörüleri, temsilcilerin bir görev boyunca izledikleri yolları gruplayarak ortak düzenleri ve aykırı değerleri ortaya çıkarır. Müşteriler sürekli izlemeyi etkinleştirebilir veya dakikalar içinde hedefli bir inceleme yürütebilir. Öneriler, sorunları güvenle çözmek için temsilcinin gerçekte nasıl davrandığına dayanarak sistem istemlerinde ve araç açıklamalarında belirli iyileştirmeler önermek için izleri ve değerlendirme çıktılarını analiz eder. Her öneri, gözlemlenen başarısızlıklara bağlı net bir gerekçe içerir ve genel bir öneri değil, üretim verilerinden türetilen hedefli bir değişikliği doğrulamaya hazır olan öneriler sunar. Toplu değerlendirme, bir değişiklik kullanıcılara ulaşmadan önce önerileri tanımlanmış bir test veri kümesine göre test eder ve birden fazla değerlendirici arasındaki toplu puanları raporlayarak regresyonları erken yakalar. Müşteriler kendileri için neyin "iyi" olduğunu tanımlar ve toplu değerlendirme, her aday değişikliğini ölçekte bu tanıma göre ölçer. A/B testi daha sonra iyileştirmelerin gerçek koşullar altında geçerli olduğunu doğrular, canlı üretim trafiğini bölerek ve sonuçları yan yana ölçerek temsilci sürümleri arasında kontrollü bir karşılaştırma yürütür. Bu, müşteriler filo genelinde uygulamaya başlamadan önce, onlara bir değişikliğin yalnızca test verilerinde değil, üretimde gerçekten işe yaradığına dair istatistiksel kanıtlar sağlar. Bu özellikler, temsilcinin nerede çalıştığına bakılmaksızın çalışır; AgentCore'un çalışma zamanı, AWS Lambda, Amazon EKS veya AWS dışı ortamlarda.
Başarısızlık, niyet ve gidişat öngörüleri bugün 13 AWS Bölgesinde önizlemede mevcuttur. Toplu değerlendirmeler, öneriler ve A/B testleri bugün 14 AWS Bölgesinde genel olarak mevcuttur. Daha fazla bilgi edinmek için Amazon Bedrock AgentCore'u ziyaret edin veya belgeleri keşfedin.