Back to Headlines

行业巨头联手NVIDIA,用Nemotron与Cosmos模型驱动下一代智能Agent

3 天前

在SIGGRAPH大会上,英伟达宣布扩展其具备推理能力的两大模型系列——NVIDIA Nemotron与NVIDIA Cosmos,助力企业与物理AI应用构建更智能的AI代理。据Capgemini预测,到2028年,AI代理有望为全球带来高达4500亿美元的收入增长与成本节约。 CrowdStrike、Uber、Zoom、Magna、NetApp等多家行业领军企业已开始采用这些模型,推动AI代理在企业流程自动化、机器人系统及物理世界交互中的应用。 新发布的NVIDIA Nemotron Nano 2和Llama Nemotron Super 1.5在同类模型中实现最高准确率,尤其在科学推理、数学计算、编程、工具调用、指令遵循和对话等任务上表现卓越。这两款模型采用混合架构、量化压缩与可配置“思考预算”技术,实现60%的推理成本降低,同时提升响应速度与深度思考能力。其中,Nemotron Nano 2的令牌生成效率比同类模型高出6倍;Llama Nemotron Super 1.5支持NVFP4格式,在NVIDIA B200 GPU上性能比H100提升高达6倍。 英伟达同步推出首个开源视觉语言模型训练数据集——Llama Nemotron VLM Dataset v1,包含300万条光学字符识别、视觉问答与图像描述数据,支持Llama 3.1 Nemotron Nano VL 8B模型训练。此外,新发布的Llama 3.2 NeMo Retriever嵌入模型在三大视觉文档检索榜单中均位列第一,显著提升AI代理的信息获取能力。 NVIDIA NeMo与NIM微服务支持AI代理从开发到部署、监控与优化的全生命周期管理。基于AI-Q NVIDIA蓝图构建的深度研究代理,目前已在DeepResearch Bench榜单中位居开放可移植代理第一。 在物理AI领域,NVIDIA Cosmos Reason作为全新开源、可定制的70亿参数推理型视觉语言模型(VLM),专为机器人与真实世界交互设计。它具备物理常识、空间时间对齐与对象恒常性理解能力,可作为机器人视觉语言动作(VLA)模型的推理核心,用于训练数据批判、视频分析与实时决策。 Uber正利用Cosmos Reason分析自动驾驶行为与复杂场景,如行人横穿高速公路;Magna将其用于城市配送机器人,提升在陌生城市中的适应能力;Centific与VAST则借助该模型实现智能视频分析,用于公共安全与工业环境监控。Ambient.ai则利用其时间与物理感知能力,自动识别安全装备缺失与危险环境。 这些模型将通过NVIDIA NIM微服务在任何NVIDIA加速基础设施上安全部署,并即将上线Amazon Bedrock、Azure AI Foundry、Oracle Data Science平台与Google Vertex AI。用户可前往build.nvidia.com体验Cosmos Reason,或从Hugging Face与GitHub下载Nemotron Nano 2与Llama Nemotron Super 1.5(NVFP4)模型。

Related Links