亚马逊AWS官方博客

Category: Artificial Intelligence

使用Graviton机型推理LLM模型实践指南

AWS Graviton处理器与Qwen3 0.6B模型的结合为企业提供了一个高性价比的LLM推理解决方案。基于ARM架构的Graviton3实例在推理性能上比同配置x86实例快15-20%,同时成本节省高达40%。通过SageMaker和Ollama可实现一键部署,支持本地内容创作、教育培训和文本分析等多种应用场景。这一技术组合不仅满足当前轻量级AI应用需求,还为企业构建成本可控、性能优异的智能化服务提供了理想的技术基础,特别适合对成本敏感且需要快速响应的生产环境部署。

基于Strands SDK 构建的企业智能问数解决方案实践

作为长期深耕数据智能的 AWS Partner,聚云立方在与众多客户共创数据问答场景时发现:传统 BI 的模板化与线性分析流程已难以支撑业务节奏。DecisionAI 基于最新的 Strands Agent 框架和 Amazon Bedrock 生态,面向 AWS 企业客户推出全新的问数 2.0 方案,希望把“问、思、判、行”全链路沉淀为可复制、可运营的智能资产。

基于NOVA MME多模态能力构建游戏资产库

最近,AWS推出了NOVA多模态embedding模型(NOVA MME),它的技术能力:将任意资产(文字,文档,图片,视屏,音频等)转换成存储在向量数据库中统一纬度的数据,然后将用户任意输入(文字,文档,图片,视屏,音频等)也转换成同维度的向量,利用余铉近似(cosine similarity)或者欧氏距离(Euclidean distance)的方式,选择出来相似度最高的资产。这种不依赖关键词匹配的新型检索方式,可以大大方便游戏资产库的构建工作。

用AI Agent重新定义数据分析:从数小时到数分钟的效率革命

本文介绍了基于Strands Agent框架构建的智能数据分析系统,将传统数据分析从3小时压缩到3分钟,实现63倍效率提升。 系统核心特点包括:智能需求澄清机制避免方向性错误,端到端自动化流程覆盖数据下载、清洗、分析和可视化,支持多轮对话式渐进分析,以及完整的计算过程追溯。通过实际 故障损失分析案例展示,系统在2分52秒内完成了数据完整性检查、基准值计算、损失分析和专业图表生成。