Amazon SageMaker HyperPod ora supporta la configurazione del ciclo di vita dei nodi basata su AMI per i cluster Slurm

Inserito il: 7 mag 2026

Amazon SageMaker HyperPod ora supporta la configurazione basata su AMI che effettua il provisioning dei nodi del cluster Slurm con il software e le configurazioni necessarie per un ambiente pronto per la produzione, in cui eseguire carichi di lavoro di addestramento AI/ML. Ciò elimina la necessità di scaricare, configurare o caricare script di configurazione del ciclo di vita su Amazon S3. Con un numero ridotto di passaggi operativi per preparare un cluster e senza script di configurazione del ciclo di vita in esecuzione durante il provisioning dei nodi, il tempo di creazione del cluster è notevolmente ridotto, consentendo di eseguire i job prima.

La configurazione basata su AMI include il software necessario, come Docker, Enroot e Pyxis e configurazioni quali l'accounting Slurm, la generazione di chiavi SSH, la rotazione dei log Slurm e la configurazione della home directory degli utenti. Per abilitare la configurazione basata su AMI, ometti il blocco LifeCycleConfig dalla configurazione del gruppo di istanze durante la creazione di cluster tramite l'API CreateCluster oppure utilizzando la console SageMaker AI, seleziona "None" alla voce script del ciclo di vita in Configurazione personalizzata. Per ulteriori personalizzazioni rispetto alla baseline della configurazione basata su AMI, è possibile fornire uno script di estensione che consente di concentrarsi esclusivamente sulle funzionalità e sul software da aggiungere, come la configurazione degli utenti, l'osservabilità o l'integrazione LDAP.

Gli script di estensione possono essere configurati durante la creazione di cluster sia tramite l'API che la console SageMaker AI. Tramite l'API CreateCluster, specifica il nuovo parametro OnInitComplete e SourceS3Uri nel blocco LifeCycleConfig. Tramite la console, fornisci l'URI S3 dello script di estensione nel campo "File dello script di estensione in S3" in Configurazione personalizzata. Per i casi d'uso avanzati che richiedono il controllo completo sul provisioning, gli script di configurazione del ciclo di vita personalizzati rimangono completamente supportati sia tramite l'API che tramite la console SageMaker AI.

Questa funzionalità è disponibile in tutte le regioni AWS in cui è supportato SageMaker HyperPod. Per iniziare a creare cluster HyperPod Slurm con la configurazione del ciclo di vita dei nodi basata su AMI, consulta Nozioni di base su SageMaker HyperPod tramite AWS CLI o Nozioni di base su SageMaker HyperPod tramite la console SageMaker AI nella guida per gli sviluppatori di SageMaker AI.