1. 主页 > 社会焦点

英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列

IT之家12月15日消息,英伟达今日发布Nemotron3开源模型系列,包括Nano、Super和Ultra三种规格,宣称是构建AI智能体应用时“具有最佳准确性的最高效开源模型家族”。

Nemotron3系列模型宣称引入了一种突破性的混合潜在专家(MoE)架构,帮助开发者大规模构建和部署可靠的多智能体系统。

英伟达表示,随着组织从单一模型聊天机器人转向协作式的多智能体AI系统,开发者面临着越来越多的挑战,包括通信开销、上下文漂移和高昂的推理成本。此外,开发者需要透明度来信任那些将自动化其复杂工作流程的模型。Nemotron3直接应对这些挑战,提供客户所需的表现力和开放性,以构建专门化的智能体AI。

早期采用者包括安永、思科、OracleCloudInfrastructure、Palantir、Perplexity、ServiceNow、西门子、Synopsys、Zoom、Accenture、Cadence和Cursor,正在将Nemotron家族的模型集成到AI工作流中,以推动制造业、网络安全、软件开发、媒体、通信等行业的应用。

开放的Nemotron3模型使初创公司能够更快地构建和迭代AI智能体,并加速从原型到企业部署的创新。

IT之家从英伟达官方获悉,Nemotron3的MoE模型系列包括三种规格:

Nemotron3Nano,一款小型的30-billion-parameter模型,每次激活最多30亿参数,适用于针对性强、高度高效的任务。

Nemotron3Super,一款高准确性的推理模型,拥有约1000亿参数,每个token最多激活100亿参数,适用于多智能体应用。

Nemotron3Ultra是一款拥有约5000亿参数和每token最多500亿活跃参数的大型推理引擎,适用于复杂的AI应用。

Nemotron3Nano宣称是目前计算成本效率最高的模型,专为软件调试、内容摘要、AI助手工作流程和低推理成本的信息检索等任务进行优化。该模型相比Nemotron2Nano实现了高达4倍的token处理吞吐量,并将推理token生成减少了60%,显著降低了推理成本。凭借100万token的上下文窗口,Nemotron3Nano能记住更多信息,使其在处理长时间、多步骤任务时更加准确且具备更强的信息关联能力。

Nemotron3Nano今日已在HuggingFace上线,Nemotron3Super和Ultra预计将在2026年上半年推出。IT之家附开源地址:

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 203304862@qq.com

本文链接:https://jinnalai.com/jiaodian/796708.html

联系我们

在线咨询:点击这里给我发消息

微信号:

工作日:9:30-18:30,节假日休息