AI Insight Hub - 最新人工智能动态

arXiv:2606.10279v1 公告类型：新摘要：人们普遍认为，利用合成基本原理数据进行监督微调可以提高语言模型在临床预测任务上的性能，不仅可以教授模型预测什么，还可以教授模型预测的原因。我们根据纵向健康史对五年阿尔茨海默病和相关痴呆症 (ADRD) 的预测检验了这一假设。在 504 个配置的大规模受控实验中，我们发现相对于仅标签微调，基于基本原理的 SFT 一致且显着地损害了预测性能。这种退化现象在模型系列和数据规模中持续存在，并且不能通过使用面向推理的基础模型来解决。至关重要的是，失败并不是由理由质量差来解释的：人类专家注释确认生成的理由在医学上是准确的，并且忠实地基于患者特定的证据，并且少量实验表明，相同的理由在用作推理时间演示而不是训练目标时可以提高性能。我们将根本原因确定为叙事合理性和歧视性优化之间的结构性冲突。我们希望我们的工作能够为更准确地理解基于理由的监督何时以及如何发挥作用以及何时没有作用铺平道路，从而指导负责任地开发用于高风险临床预测的语言模型。

利用综合基本原理数据进行监督微调会损害现实世界的疾病预测

相关文章推荐

通过 OLMo 3 的培训追踪评估意识的出现

RealMath-Eval：为什么 SOTA 评委在真实的人类推理方面遇到困难

制度：使用 ActiveGraph 在 LongMemEval 上演示的可审计、保留的改进循环