AI Insight Hub
图片转PPT
Image2PPT
图片转PPT神器
首页
分类
关于
管理后台
首页
分类
关于
管理后台
来源:ArXiv AI
2025-10-09 04:00
翻译成中文
AlphaApollo:将基础模型和专业工具编排成用于深度代理推理的自我进化系统
工具
模型
AlphaApollo
推理
系统
arXiv:2510.06261v1 公告类型:新 摘要:我们提出了 AlphaApollo,一种自我进化的代理推理系统,旨在解决基础模型(FM)推理中的两个瓶颈——有限的模型内在能力和不可靠的测试时间迭代。 AlphaApollo 使用专业工具协调多个模型,以实现深思熟虑、可验证的推理。它将 (i) 计算工具(带有数字和符号库的 Python)和 (ii) 检索工具(与任务相关的外部信息)结合起来,以执行精确的计算和基本决策。该系统通过记录候选、可执行检查和迭代细化反馈的共享状态图进一步支持多轮、多模型解决方案演进。在跨多个模型的 AIME 2024/2025 评估中,AlphaApollo 提供了一致的增益:Qwen2.5-14B-Instruct 的 +5.15% Average@32 和 +23.34% Pass@32,以及 Llama-3.3-70B-Instruct 的 +8.91% Average@32 和 +26.67% Pass@32。工具使用分析表明,超过 80% 的工具调用成功执行,并且始终优于非工具基线,从而提高了 FM 的能力上限。更多实证结果和实施细节将在 https://github.com/tmlr-group/AlphaApollo 更新。
查看原始链接
相关文章推荐
EvoTest:自我改进代理系统的进化测试时学习
2025-10-16
通过目标驱动的学习者状态建模进行个性化学习路径规划
2025-10-16
自适应推理执行器:高效推理的协作代理系统
2025-10-16
返回首页