Due nuovi modelli per il coding agentico e l'IA efficiente sono ora disponibili in Amazon SageMaker JumpStart
Oggi AWS rende disponibili GLM-5.1-FP8 e Phi-4-mini-instruct in Amazon SageMaker JumpStart, ampliando l'offerta di modelli di fondazione disponibili per i clienti AWS. Questi modelli di Z.ai e Microsoft offrono funzionalità agentiche avanzate e un'inferenza efficiente per i carichi di lavoro di IA per le aziende sull'infrastruttura AWS.
I modelli rispondono a diverse sfide dell'IA per le aziende con capacità dedicate:
GLM-5.1-FP8 eccelle nell'ingegneria del software agentica con un'ottimizzazione prolungata a più turni, gestendo la generazione di codice a livello di repository, attività da terminale e complessi flussi di lavoro di debug che migliorano con un ragionamento esteso. È ideale per pipeline di revisione automatizzata del codice, ambienti di sviluppo basati sull'IA e la risoluzione di problemi a lungo termine in cui il modello esegue centinaia di iterazioni per perfezionare le soluzioni.
Phi-4-mini-instruct eccelle nel ragionamento avanzato, nella matematica e nella logica in ambienti con vincoli di memoria e di latenza, supportando 24 lingue e la chiamata di funzioni in un fattore di forma compatto. È ideale per distribuzioni edge, applicazioni sensibili alla latenza, chatbot multilingue e scenari in cui i clienti necessitano di elevate capacità di ragionamento con un sovraccarico minimo di risorse.
SageMaker JumpStart consente ai clienti di distribuire uno qualsiasi di questi modelli con pochi clic per rispondere a specifici casi d'uso di IA.
Per iniziare, è possibile accedere alla sezione Modelli di SageMaker Studio oppure utilizzare l’SDK Python di SageMaker per distribuire i modelli nel proprio account AWS. Per ulteriori informazioni sulla distribuzione e l'utilizzo dei modelli di fondazione in SageMaker JumpStart, consulta la documentazione di Amazon SageMaker JumpStart.