Page 1 of 1

深入探究:约束解码

Posted: Sun Mar 02, 2025 5:14 am
by ayesha112
Vivien 介绍了每种方法的优缺点。提示工程是最直接的实现方式;但是,虽然您可以在提示中明确说明格式约束,但它可能无法保证生成的输出符合严格的要求。

相比之下,监督式微调使用格式正确 贝宁 WhatsApp 号码列表 的示例来重新训练 LLM,从而在不影响质量的情况下更好地完成给定任务。但是,微调需要大量高质量的标记训练数据,以及专业知识和计算资源,而且微调后的模型泛化能力不佳。

约束解码可以被认为是三种方法中最强大的方法,即使对于复杂的约束也能确保 100% 合规,而无需进行微调。

约束解码的工作原理是创建一个过滤器(称为“掩码”),该过滤器会屏蔽掉底层标记概率分布中不符合要求标准的任何单词或标记。例如,如果我们需要 LLM 生成 1 到 5 的分数,则约束解码会使用一个掩码,该掩码仅允许这些特定数字,排除所有其他单词。这可确保模型的响应 100% 符合要求,从而消除生成超出范围的响应的任何可能性。