Amazon SageMaker HyperPod prend désormais en charge la configuration du cycle de vie des nœuds basée sur AMI pour les clusters Slurm
Amazon SageMaker HyperPod prend désormais en charge la configuration basée sur AMI, qui fournit aux nœuds de cluster Slurm les logiciels et les configurations nécessaires à un environnement prêt pour la production permettant d’exécuter des charges de travail d’entraînement IA/ML. Il n’est donc plus nécessaire de télécharger, de configurer ni de charger des scripts de configuration du cycle de vie sur Amazon S3. En réduisant le nombre d’étapes opérationnelles nécessaires à la préparation d’un cluster et en l’absence de scripts de configuration du cycle de vie exécutés pendant le provisionnement des nœuds, le temps de création du cluster est considérablement réduit, ce qui vous permet de commencer à exécuter les tâches plus rapidement.
La configuration basée sur AMI inclut les logiciels requis tels que Docker, Enroot et Pyxis, ainsi que des configurations telles que la comptabilité Slurm, la génération de clés SSH, la rotation des journaux Slurm et la configuration du répertoire personnel des utilisateurs. Pour activer la configuration basée sur AMI, omettez le bloc LifecycleConfig de la configuration du groupe d’instances lorsque vous créez des clusters à l’aide de l’API CreateCluster ou lorsque vous utilisez la console SageMaker AI, sélectionnez « Aucun » sous Scripts de cycle de vie dans Configuration personnalisée. Pour une personnalisation supplémentaire en plus de la configuration de base basée sur l’AMI, un script d’extension peut être fourni, vous permettant de vous concentrer uniquement sur les fonctionnalités et les logiciels à ajouter, tels que la configuration utilisateur, l’observabilité ou l’intégration LDAP.
Les scripts d’extension peuvent être configurés lors de la création de clusters via l’API et la console SageMaker AI. À l’aide de l’API CreateCluster, spécifiez le nouveau paramètre OnInitComplete et Sources3URI dans le bloc LifecycleConfig. À l’aide de la console, fournissez l’URI S3 au script d’extension dans le champ « Fichier de script d’extension dans S3 » de la configuration personnalisée. Pour les cas d’utilisation avancés nécessitant un contrôle total du provisionnement, les scripts de configuration du cycle de vie personnalisés restent entièrement pris en charge via l’API et la console SageMaker AI.
Cette caractéristique est disponible dans toutes les Régions AWS dans lesquelles Amazon SageMaker HyperPod est disponible. Pour commencer à créer des clusters HyperPod Slurm avec une configuration du cycle de vie des nœuds basée sur l’AMI, consultez Démarrage avec SageMaker HyperPod à l’aide de l’AWS CLI ou Démarrage avec SageMaker HyperPod à l’aide de la console SageMaker AI dans le Guide du développeur de SageMaker AI.