NVIDIA发布Nemotron 3 Nano Omni多模态模型，助力企业AI智能体效率提升

发布时间：2026-05-06 13:44:13

A今日发布Nemotron 3 Nano Omni，一款面向企业级应用的开源多模态模型。该模型将视觉、语音与语言处理能力集成于单一系统，支持对视频、音频、图像和文本进行统一推理，从而减少跨模型数据传输带来的延迟与上下文丢失，提升响应速度与智能化水平。

Nemotron 3 Nano Omni为企业与开发者提供了高性能、高可控性的多模态智能体构建路径，兼顾部署灵活性与准确度。该模型在复杂文档理解、视频与音频分析等六项评测中名列前茅，展现了领先的性价比与效率优势。

目前，Aible、ASI、Eka Care、Foxconn、H Company、Palantir、Pyler等AI及软件公司已采用该模型；戴尔科技、Docusign、Infosys、K-Dense、Lila、Oracle与Zefr等企业正在评估中。

依托30B至A3B参数的混合专家架构，Nemotron 3 Nano Omni集成了视觉与音频编码器，无需额外感知模块，大幅提升推理效率。在保持相同交互性能的前提下，其吞吐量比其他开源全模态模型高出9倍。

该模型现已上线Hugging Face、OpenRouter及NVIDIA NIM，支持从NVIDIA Jetson边缘设备到数据中心的一致化部署。