NVIDIA发布Nemotron 3 Nano Omni多模态模型,助力企业AI智能体效率提升
发布时间:2026-05-04 13:44:13
A今日发布Nemotron 3 Nano Omni,一款面向企业级应用的开源多模态模型。该模型将视觉、语音与语言处理能力集成于单一系统,支持对视频、音频、图像和文本进行统一推理,从而减少跨模型数据传输带来的延迟与上下文丢失,提升响应速度与智能化水平。
Nemotron 3 Nano Omni为企业与开发者提供了高性能、高可控性的多模态智能体构建路径,兼顾部署灵活性与准确度。该模型在复杂文档理解、视频与音频分析等六项评测中名列前茅,展现了领先的性价比与效率优势。
目前,Aible、ASI、Eka Care、Foxconn、H Company、Palantir、Pyler等AI及软件公司已采用该模型;戴尔科技、Docusign、Infosys、K-Dense、Lila、Oracle与Zefr等企业正在评估中。
依托30B至A3B参数的混合专家架构,Nemotron 3 Nano Omni集成了视觉与音频编码器,无需额外感知模块,大幅提升推理效率。在保持相同交互性能的前提下,其吞吐量比其他开源全模态模型高出9倍。
该模型现已上线Hugging Face、OpenRouter及NVIDIA NIM,支持从NVIDIA Jetson边缘设备到数据中心的一致化部署。
