AI Insight Hub
图片转PPT
Image2PPT
图片转PPT神器
首页
分类
关于
管理后台
首页
分类
关于
管理后台
来源:ArXiv AI
2025-10-15 04:00
翻译成中文
ThinkPilot:通过自动思考前缀优化引导推理模型
推理
ThinkPilot
前缀
LRM
行为
arXiv:2510.12063v1 公告类型:新 摘要:大型推理模型(LRM)很强大,但它们仍然存在低效和脱靶推理的问题。目前,免培训方法仅限于严格的启发式或描述性的、不可操作的分析。在本文中,我们介绍了 ThinkPilot,这是一个无需训练的框架,可以自动优化 LRM 推理。它使用进化过程来生成思考前缀,这些前缀是由推理行为分类驱动进化的指令,以指导模型获得卓越的性能。大量实验证明了 ThinkPilot 的广泛有效性:它显着改善了高效推理的准确性与长度权衡,大幅提高了安全性(例如,将 DeepSeek-R1-Distill-Qwen-32B 的 StrongREJECT 分数从 27.0% 削减到 0.7),并增强了指令遵循能力。它还与现有的基于培训的方法协同作用。我们的分析表明,思考前缀可以可靠地控制 LRM 的推理行为,并且不同的任务对特定的行为分布有强烈的偏好。通过自动识别和引发这些行为,ThinkPilot 提供了一个通用框架,使 LRM 推理与任务需求保持一致。数据和代码可在 https://github.com/teqkilla/ThinkPilot 获取
查看原始链接
相关文章推荐
人工智能代理作为通用任务求解器
2025-10-15
赋予法学硕士代理人地理空间意识:野火响应的扎根推理
2025-10-15
大型语言模型尊重契约吗?评估和执行代码生成中的契约遵守情况
2025-10-15
返回首页