Amazon Bedrock AgentCore apresenta novos recursos de otimização para melhorar continuamente os agentes em produção
Hoje, a AWS anuncia novos recursos de otimização no AgentCore que transformam os rastreamentos de produção em melhoria contínua para os agentes. As falhas mais perigosas dos agentes não são aquelas que geram erros. São aquelas silenciosas, que parecem estar tudo certo nos painéis. Essas falhas não geram qualquer sinal de erro e muitas vezes só aparecem semanas depois, por meio de reclamações de clientes. O AgentCore elimina essa lacuna com um loop capaz de entender o que os agentes estão fazendo, gerar correções baseadas em dados e comprovar que elas funcionam.
Para entender o comportamento do agente, o AgentCore revela insights sobre falhas, intenções e trajetórias de centenas de sessões, o que expõe padrões que nenhum painel ou análise de rastreamento individual conseguiria identificar. Os insights sobre falhas identificam padrões recorrentes de falhas, incluindo falhas comportamentais silenciosas, explicam a causa raiz de cada uma e as classificam conforme sua abrangência, para que as equipes corrijam primeiro os problemas que afetam o maior número de usuários. Os insights sobre intenções agrupam solicitações com base no que os usuários estavam tentando fazer, e os insights sobre trajetórias agrupam os caminhos que os agentes percorrem ao executar uma tarefa, revelando padrões comuns e discrepâncias. Os clientes podem habilitar o monitoramento contínuo ou conduzir uma investigação direcionada em questão de minutos. Para corrigir problemas com confiança, as recomendações analisam rastros e resultados de avaliações para sugerir melhorias específicas nos prompts de sistema e nas descrições de ferramentas, fundamentadas no comportamento real do agente. Cada recomendação inclui uma justificativa clara, vinculada às falhas observadas, e vem pronta para validar, não é uma sugestão genérica, mas uma mudança direcionada derivada de dados de produção. Antes que uma alteração chegue aos usuários, a avaliação em lote testa as recomendações em relação a um conjunto de dados de testes definido e apresenta pontuações agregadas de vários avaliadores, o que identifica regressões antecipadamente. Os clientes definem o que significa “bom”, e a avaliação em lote mede cada alteração candidata em escala com base nesse parâmetro. O teste A/B então confirma se as melhorias se mantêm em condições reais, executando uma comparação controlada entre versões do agente ao dividir o tráfego de produção e medir os resultados lado a lado. Isso fornece evidências estatísticas de que uma alteração realmente funciona em produção, e não apenas nos dados de teste, antes de os clientes decidirem aplicá‑la em toda a frota. Esses recursos funcionam independentemente de onde os agentes são executados: no runtime do AgentCore, no AWS Lambda, no Amazon EKS ou em ambientes fora da AWS.
Os insights sobre falhas, intenções e trajetórias estão disponíveis em versão prévia hoje em 13 regiões da AWS. As avaliações em lote, as recomendações e os testes A/B estão disponíveis hoje em 14 regiões da AWS. Para saber mais, acesse o Amazon Bedrock AgentCore ou explore a documentação.