DAWN：针对扩散大语言模型的依赖感知快速推理

•

原作者:Lizhuo Luo et al.

•

2026年2月6日

Gemini AI生成的图像

本文介绍了一种名为DAWN的新方法，该方法旨在提高扩散大型语言模型（dLLMs）的推理速度，同时不影响输出质量。DAWN通过建模标记之间的依赖关系，解决了传统并行解码的低效问题，从而实现了更可靠的标记解掩蔽。实验结果表明，与现有方法相比，DAWN的推理速度提升了1.80至8.06倍，同时保持了生成质量。相关代码已在GitHub上发布，供实现使用。

新解码方法DAWN提升扩散大语言模型的推理速度

研究人员推出了DAWN，这是一种新颖的解码技术，旨在优化扩散大语言模型（dLLMs）的推理速度。该方法解决了现有并行解码策略的低效问题。

DAWN采用了一种无训练、依赖感知的方法，构建了一个依赖图以优先考虑标记之间的关系。它关注两个关键见解：

依赖于某些未屏蔽标记的位置能够生成更可靠的输出。
同时未屏蔽多个强相关的标记可能会导致生成错误。

DAWN有效地在每次迭代中选择最可靠的未屏蔽位置，实现高水平的并行性，同时保持文本质量。实验表明，DAWN的推理速度比现有基准快1.80到8.06倍，且不会降低输出质量。DAWN的代码已在GitHub上公开发布。

分享此文章

Twitter Facebook LinkedIn WhatsApp Reddit

DAWN：针对扩散大语言模型的依赖感知快速推理

新解码方法DAWN提升扩散大语言模型的推理速度

相关主题：

分享此文章