Amazon Bedrock Değerlendirmeleri
İhtiyaçlarınıza uygun modelleri bulmak için özel ve içe aktarılmış modeller de dahil olmak üzere altyapı modellerini değerlendirin. Ayrıca Amazon Bedrock Bilgi Tabanları'nda geri alma veya uçtan uca RAG iş akışınızı da değerlendirebilirsiniz.
Genel Bakış
Amazon Bedrock, üretken yapay zeka uygulamalarının benimsenmesini hızlandırmanız için değerlendirme araçları sağlar. Model Değerlendirmesi ile kullanım örneğiniz için altyapı modeli değerlendirmesi, karşılaştırması ve seçimi yapın. Alma ya da alma ve oluşturma işlevlerini değerlendirerek Amazon Bedrock Bilgi Tabanları veya özel RAG sistemleriniz üzerinde oluşturulan RAG uygulamalarınızı üretime hazırlayın.
Değerlendirme türleri
Doğruluk, eksiksizlik ve zararlılık gibi ölçümlerle özel istem veri kümelerinizi kullanarak model çıktılarını değerlendirmek için Yargıç olarak LLM kullanın.
Model çıktılarını geleneksel doğal dil algoritmaları ve BERT Skoru, F1 ve diğer tam eşleştirme teknikleri gibi ölçümler kullanarak, yerleşik istem veri kümelerini kullanarak veya kendi veri kümelerinizi getirerek değerlendirin.
Model çıktılarını kendi iş gücünüzle değerlendirin veya özel istem veri kümelerinize verilen yanıtlarla ilgili değerlendirmelerinizin AWS tarafından yerleşik veya özel ölçümlerle yönetilmesini sağlayın.
Özel RAG sisteminizin veya Amazon Bedrock Bilgi Tabanlarınızın alma kalitesini istemlerinizin yanı sıra bağlam alaka düzeyi ve bağlam kapsamı gibi ölçümleriniz ile değerlendirin.
Özel RAG işlem hattınızdan veya Amazon Bedrock Bilgi Tabanlarınızdan gelen uçtan uca RAG iş akışınızda oluşturulan içeriği değerlendirin. Kendi istemlerinizi ve sadakat (halüsinasyon algılama), doğruluk ve eksiksizlik gibi ölçümlerinizi kullanın.
Uçtan uca RAG iş akışınızı değerlendirin
RAG sisteminizden eksiksiz ve alakalı alma sağlayın
FM'leri değerlendirerek kullanım örneğiniz için en iyi olanı seçin
Daha hızlı karar almak için birden fazla değerlendirme işinden elde edilen sonuçları karşılaştırın