4006605680

迈络思交换机,mellanox交换机,迈络思IB网卡,迈络思IB交换机,迈络思线缆,迈络思网卡,无线ap,英伟达,NVIDIA, Mellanox交换机, Mellanox 高速以太网交换机, 低延迟 Mellanox 交换机, 数据中心, Mellanox 交换机, 高性能计算, Mellanox 交换机, 云计算用 Mellanox 交换机, Mellanox 交换机网络带宽
目前位置:首页>>新闻中心

NVIDIA 提升小语言模型 Bash 命令生成能力:语法约束解码技术突破

发布时间:2026-05-19 17:58:51

Bash 是 AI 智能体可用的最灵活、最强大的接口之一。一个能够生成 grep、curl、tar 或 shell 管道的模型,就是在产生可执行的操作。对于 NVIDIA AI 红队来说,命令生成是一个重要的研究目标。如果小语言模型可以被引导生成有效、符合策略的命令结构,它们就能成为更可靠的智能体工作流组件。

约束解码是一种在自回归语言模型生成过程中修改采样过程的技术。在每一步生成中,模型照常产生 logits,但在选择 token 之前,会应用语法来改变概率分布(通常是通过有效屏蔽某些 token)。PICARD 曾使用此技术改进 SQL 生成,NVIDIA AI 红队将同样的概念应用于 Bash。

研究团队对 13 个小语言模型进行了 299 项任务的测试,结果表明平均通过率从 62.5% 提升至 75.2%。最显著的成果来自 Qwen3-0.6B 模型,其通过率从 16.7% 提升至 59.2%。这意味着即使是参数量极小的模型,通过约束解码也能大幅提升 Bash 命令生成的可靠性。

研究团队开发了名为 grammargen 的工具,能够将结构化的命令证据自动转换为 Lark 语法格式。该工具捕获了命令名称、别名、布尔型短标志和长标志、带值标志、位置参数等关键信息,并设置有限重复以保持解码状态的有限性。

这项技术对于提升 AI 智能体的安全性和可靠性具有重要意义。通过语法约束解码,小模型在产生 shell 命令时能够有效避免语法错误和危险操作,使其更适合部署到广泛的自动化工作流环境中。