来源:ArXiv AI 2025-10-15 04:00

人工智能代理作为通用任务求解器

学习 时间 代理 任务 推理
arXiv:2510.12066v1 公告类型:新 摘要:人工智能推理代理已经能够通过部署工具、模拟多种假设的结果并对其进行反思来解决各种任务。在此过程中,它们执行计算,尽管不是传统意义上的计算——没有程序被执行。不过,如果人工智能代理执行计算,它们可以通用吗?思维链推理可以解决任何可计算的任务吗? AI 代理如何学习推理?是模型大小的问题吗?或者训练数据集大小? 在这项工作中,我们重新解释了人工智能代理背景下的学习作用,将它们视为具有计算能力的随机动力系统,并强调了时间在学习推理的基本原则中的作用。在此过程中,我们提出从经典归纳学习转向转导学习——其目标不是近似过去数据的分布,而是捕捉它们的算法结构,以减少找到新任务解决方案所需的时间。 传导学习表明,与香农的理论相反,信息在学习中的关键作用是减少时间而不是重建误差。特别是,我们表明通用求解器使用过去的数据可以实现的最佳加速与其算法信息密切相关。利用这一点,我们展示了观察到的推理时间与训练时间的幂律缩放的理论推导。然后,我们证明,缩放模型大小可能会导致一些行为,虽然提高了基准测试的准确性,但无法通过任何合理的智力测试,更不用说超级智能了:在无限空间和时间的限制下,大型模型可以表现得像专家,能够在没有任何洞察力的情况下暴力地完成任何任务。相反,我们认为扩展推理模型时要优化的关键量是时间,迄今为止,时间在学习中的关键作用仅被间接考虑。

相关文章推荐

返回首页