亚马逊AWS官方博客
Category: Artificial Intelligence
使用Graviton机型推理LLM模型实践指南
AWS Graviton处理器与Qwen3 0.6B模型的结合为企业提供了一个高性价比的LLM推理解决方案。基于ARM架构的Graviton3实例在推理性能上比同配置x86实例快15-20%,同时成本节省高达40%。通过SageMaker和Ollama可实现一键部署,支持本地内容创作、教育培训和文本分析等多种应用场景。这一技术组合不仅满足当前轻量级AI应用需求,还为企业构建成本可控、性能优异的智能化服务提供了理想的技术基础,特别适合对成本敏感且需要快速响应的生产环境部署。
Anthropic最新推出的基础模型Claude Opus 4.5现已上线Amazon Bedrock
Amazon Bedrock作为一项全托管服务,集成了多家顶尖AI公司的高性能基础模型,为用户提供灵活选择。O […]
AWS 一周综述:如何参加 AWS re:Invent 2025、Kiro 正式版以及众多发布内容(2025 年 11 月 24 日)
下周,千万不要错过 2025 年 12 月 1 日 – 5 日举行的 AWS re:Invent […]
Agentic AI基础设施实践经验系列(九):Context Engineering 上下文工程
在本文中,我们将介绍上下文工程在Agent应用的场景与实践,结合AWS Bedrock AgentCore, Strands Agent等能力,构建起具有从上下文检索与生成,上下文管理到上下文处理的完整框架,帮助企业实现兼具成本,性能与扩展性的新一代智能体。
基于Strands SDK 构建的企业智能问数解决方案实践
作为长期深耕数据智能的 AWS Partner,聚云立方在与众多客户共创数据问答场景时发现:传统 BI 的模板化与线性分析流程已难以支撑业务节奏。DecisionAI 基于最新的 Strands Agent 框架和 Amazon Bedrock 生态,面向 AWS 企业客户推出全新的问数 2.0 方案,希望把“问、思、判、行”全链路沉淀为可复制、可运营的智能资产。
基于NOVA MME多模态能力构建游戏资产库
最近,AWS推出了NOVA多模态embedding模型(NOVA MME),它的技术能力:将任意资产(文字,文档,图片,视屏,音频等)转换成存储在向量数据库中统一纬度的数据,然后将用户任意输入(文字,文档,图片,视屏,音频等)也转换成同维度的向量,利用余铉近似(cosine similarity)或者欧氏距离(Euclidean distance)的方式,选择出来相似度最高的资产。这种不依赖关键词匹配的新型检索方式,可以大大方便游戏资产库的构建工作。
基于 MIG 技术在 Amazon SageMaker HyperPod 上实现 GPU 虚拟化的最佳实践
本文深入探讨了如何在Amazon EKS环境中部署和管理MIG技术,实现GPU资源的最大化利用,并提供了实施落地的实践脚本和方案
用AI Agent重新定义数据分析:从数小时到数分钟的效率革命
本文介绍了基于Strands Agent框架构建的智能数据分析系统,将传统数据分析从3小时压缩到3分钟,实现63倍效率提升。 系统核心特点包括:智能需求澄清机制避免方向性错误,端到端自动化流程覆盖数据下载、清洗、分析和可视化,支持多轮对话式渐进分析,以及完整的计算过程追溯。通过实际 故障损失分析案例展示,系统在2分52秒内完成了数据完整性检查、基准值计算、损失分析和专业图表生成。
全新 Amazon Bedrock 服务层级助您兼顾 AI 工作负载的性能和成本
今天,Amazon Bedrock 推出了全新的服务层级,让您能够在满足应用程序所需性能的同时,更好地控制 […]
制造业智能化转型新引擎:基于AWS Bedrock AgentCore构建生产管理智能体系统
随着Agentic AI技术的发展,智能体在制造业中的应用场景将逐步扩展。制造业企业可以考虑采用AWS Bedrock AgentCore等成熟的技术平台,结合自身业务需求,逐步构建和完善智能制造系统。

