通过代数不变量为法学硕士进行结构化溯因-演绎-归纳推理
15727v1 公告类型新 摘要大型语言模型在结构化逻辑推理中表现出系统性局限性它们将假设生成与验证混为一谈,无法区分猜想和经过验证的知识,并允许弱推理步骤通过推理链不受检查地传播。这一原则独立地作为可能性逻辑中最薄弱的环节解决方案,并通过思想链推理的经验验证,可以防止逻辑不一致在多步推理中累积。我们通过基于属性的测试套件验证所有不变量,该测试套件包含 100 个属性和 16 个模糊测试,超过 105 生成的案例,提供经过验证的不变量参考实现,适合作为未来推理基准的基础