As instâncias de Caderno do SageMaker já são compatíveis com os tipos de instância G6e.4xl
Temos o prazer de anunciar a disponibilidade geral das instâncias G6e.4xl do Amazon EC2 nas instâncias de caderno do SageMaker.
As instâncias G6e do Amazon EC2 se baseiam em até 8 GPUs NVIDIA L40s Tensor Core com 48 GB de memória por GPU e processadores AMD EPYC de terceira geração. As instâncias G6e entregam performance até 2,5 vezes melhor em comparação com as instâncias G5 do EC2. Os clientes podem usar as instâncias G6e para testar interativamente a implantação de modelos e para casos de uso de treinamento interativo de modelos, como ajuste fino de IA generativa. Você pode usar as instâncias G6e para implantar tanto grandes modelos de linguagem (LLMs) com até 13 bilhões de parâmetros como modelos de difusão para gerar imagens, vídeo e áudio.
As instâncias G6e do Amazon EC2 estão disponíveis em instâncias de notebook SageMaker nas regiões da AWS Leste dos EUA (Norte da Virgínia e Ohio), Oeste dos EUA (Oregon), Ásia-Pacífico (Tóquio), Oriente Médio (Dubai) e Europa (Frankfurt, Suécia, Espanha).
Acesse os guias do desenvolvedor para obter instruções sobre como configurar e usar as aplicações JupyterLab e Editor de Código no SageMaker Studio e nas instâncias de caderno do SageMaker.