Amazon Bedrock AgentCore introduce nuove funzionalità di ottimizzazione per migliorare continuamente gli agenti in produzione

Inserito il: 17 giu 2026

Oggi, AWS annuncia nuove funzionalità di ottimizzazione in AgentCore che trasformano le tracce di produzione in un miglioramento continuo per gli agenti. I malfunzionamenti più pericolosi degli agenti non sono quelli che generano errori. Sono quelli silenziosi che non mostrano anomalie all'interno delle dashboard. Questi errori non producono alcun segnale di anomalia e spesso emergono tramite i reclami dei clienti settimane più tardi. AgentCore colma questa lacuna con un ciclo progettato per capire cosa stanno facendo gli agenti, generare correzioni basate sui dati e dimostrare che funzionano.

Per comprendere il comportamento degli agenti, AgentCore fornisce analisi su errori, intenti e traiettorie in centinaia di sessioni, rivelando modelli che nessuna dashboard o revisione singola delle tracce riuscirebbe a rilevare. Le analisi degli errori rilevano i modelli di errore ricorrenti, compresi i problemi comportamentali silenziosi, spiegano la causa principale di ciascuno e li classificano in base alla loro diffusione, in modo che i team possano risolvere per primi i problemi che colpiscono la maggior parte degli utenti. Le analisi degli intenti raggruppano le richieste in base a ciò che gli utenti stavano cercando di fare, mentre le analisi delle traiettorie raggruppano i percorsi intrapresi dagli agenti nello svolgimento di un'attività, facendo emergere schemi comuni e valori anomali. I clienti possono abilitare il monitoraggio continuo o eseguire un'indagine mirata in pochi minuti. Per risolvere i problemi con sicurezza, i consigli analizzano le tracce e i risultati delle valutazioni per suggerire miglioramenti specifici per i prompt di sistema e le descrizioni degli strumenti, basandosi sul comportamento effettivo dell'agente. Ogni raccomandazione include una chiara motivazione legata agli errori osservati ed è pronto per la convalida: non si tratta di un suggerimento generico, ma di una modifica mirata derivata dai dati di produzione. Prima che una modifica raggiunga gli utenti, la valutazione in batch verifica le soluzioni proposte rispetto a un set di dati di test definito e riporta i punteggi aggregati su più valutatori, rilevando precocemente le regressioni. I clienti definiscono i criteri di idoneità e la valutazione in batch misura su larga scala ogni modifica proposta rispetto a quella soglia di riferimento. I test A/B confermano poi che i miglioramenti siano validi in condizioni reali, eseguendo un confronto controllato tra le versioni degli agenti tramite la suddivisione del traffico di produzione in tempo reale e misurando i risultati fianco a fianco. Ciò fornisce la prova statistica che una modifica funziona effettivamente in produzione, e non solo sui dati di test, prima che i clienti si impegnino a distribuirla sull'intera infrastruttura. Queste funzionalità operano indipendentemente da dove vengono eseguiti gli agenti: sull'ambiente di runtime di AgentCore, su AWS Lambda, su Amazon EKS o in ambienti non AWS.

Le analisi su errori, intenti e traiettorie sono disponibili in anteprima oggi in 13 regioni AWS. Le valutazioni in batch, i consigli e i test A/B sono generalmente disponibili oggi in 14 regioni AWS. Per saperne di più, visita Amazon Bedrock AgentCore o consulta la documentazione.