来源:ArXiv AI 2026-06-01 04:00

用于重新定位莱文树搜索的结构诱导信息

重新 搜索 基于 根器 定位
arXiv:2605.30664v1 公告类型:新 摘要:基于子目标的策略树搜索使用策略来指导搜索,对于复杂的单代理确定性问题有效,但通常依赖于显式子目标生成,这可能会产生大量开销并阻碍可扩展性。在本文中,我们通过最近引入的 $\sqrt{\text{LTS}}$ 算法使用学习的“rerooter”来克服这些限制。重新定位者隐式地将问题分解为软子任务。虽然之前的工作重点是给定或手工制作的重新根器的正式保证,但在这项工作中,我们提出了三种重新根器设计:(i)利用全局状态空间结构的基于集群的重新根器,(ii)利用学习的成本估计的基于启发式的重新根器,以及(iii)结合这两种信号的混合器。我们的框架避免了必须显式地重建和推理生成的子目标,从而能够以显着降低的计算开销实现搜索工作的可扩展分配。根据经验,我们基于重新定位的方法可以扩展到基于子目标的策略树搜索失败的复杂环境,并在测试领域实现最先进的在线训练效率。

相关文章推荐

返回首页