AI Insight Hub - 最新人工智能动态

arXiv:2604.15726v1 公告类型：新摘要：这篇立场文件认为，大语言模型（LLM）推理应该作为潜在状态轨迹形成来研究，而不是作为忠实的表面思想链（CoT）来研究。这很重要，因为有关忠实性、可解释性、推理基准和推理时间干预的主张都取决于该领域将推理的主要对象是什么。我们问，一旦三个经常混淆的因素被分离出来，并形式化三个相互竞争的假设，这个对象应该是什么：H1，推理主要由潜在状态轨迹介导；H1，推理主要由潜在状态轨迹介导； H2，推理主要由显式表面 CoT 介导；和 H0，最明显的推理增益可以通过通用串行计算比任何特权表征对象更好地解释。在这个框架下重新组织最近的实证、机械和调查工作，并添加计算审计的工作范例，将表面痕迹、潜在干预措施和匹配的预算扩张分解，我们发现当前的证据最有力地支持H1作为默认的工作假设，而不是作为独立于任务的结论。因此，我们提出两个建议：该领域应将潜态动力学视为 LLM 推理的默认研究对象，并且应使用明确解开表面痕迹、潜态和串行计算的设计来评估推理。

LLM推理是潜在的，而不是思想链

相关文章推荐

通过代数不变量为法学硕士进行结构化溯因-演绎-归纳推理

世界泄露了未来：利用进化来预测未来

通过蒙特卡罗树搜索对智能体技能进行双层优化