来源:ArXiv AI 2026-04-20 04:00

通过蒙特卡罗树搜索对智能体技能进行双层优化

优化 组件 结构 双层 textttskill
arXiv:2604.15709v1 公告类型:新 摘要:智能体\texttt{技能}是指令、工具和支持资源的结构化集合,可帮助大型语言模型(LLM)智能体执行特定类别的任务。经验证据表明,\texttt{skills} 的设计可以对代理任务性能产生重大影响,但系统地优化 \texttt{skills} 仍然具有挑战性。由于技能以结构化方式包含指令、工具和支持资源,因此对其进行优化需要共同确定这些组件的结构以及每个组件包含的内容。这产生了一个复杂的决策空间,其结构和组件之间具有很强的相互依赖性。因此,我们将这两个耦合决策表示为 \texttt{skill} 结构和组件内容,并将 \texttt{skill} 优化制定为双层优化问题。我们提出了一个双层优化框架,其中外循环采用蒙特卡罗树搜索来确定 \texttt{skill} 结构,而内循环则细化外循环选择的结构内的组件内容。在这两个循环中,我们都使用 LLM 来协助优化过程。我们在开源运筹学问答数据集上评估了所提出的框架,实验结果表明,双层优化框架通过优化的 \texttt{skill} 提高了代理的性能。

相关文章推荐

返回首页