亚马逊AWS官方博客

面向 GPU 服务器的 SageMaker 无痛使用指南(三)—SageMaker HyperPod 集群

SageMaker HyperPod 集群是一种基于 Slurm 的高性能弹性计算集群,可以实现跨机器跨 GPU 的大规模并行训练。 它提供了原生的 IaaS 基础设施服务器,可以自由操控和部署各种模型和框架,充分发挥亚马逊云端可伸缩的计算能力,显著缩短了大模型在海量数据集上的训练时间。 本文详细介绍了 SageMaker Hyperpod 集群的启动、配置、连接、管理和在其上进行分布式训练的方法。

面向 GPU 服务器的 SageMaker 无痛使用指南(一)—SageMaker Notebook 笔记本实例

本系列博客旨在整理面向原生 GPU 服务器的 SageMaker 使用方法,包括 SageMaker Notebook 实例、Training Job 训练任务、Inference Endpoint 推理端点、SageMaker Hyperpod HPC 高性能集群等各种 SageMaker 功能组件。本文介绍 SageMaker Notebook 笔记本实例上 GPU 服务器的使用方法。

Shulex 携手亚马逊云科技与 Zilliz, 打造 VOC 数字化“加速器”

Shulex 已经将上亿数据量的核心业务从开源向量数据库 Milvus 迁移至全托管的向量数据库云服务 Zilliz Cloud。相比于 Milvus,Zilliz Cloud 实现了 Shulex VOC 评论分析洞察报告生成速度 30% 的提升,VOC 智能客服召回率 98%,且系统稳定,0 宕机,大大降低了企业在向量数据库的运维成本。