AI Insight Hub
图片转PPT
Image2PPT
图片转PPT神器
首页
分类
关于
管理后台
首页
分类
关于
管理后台
来源:ArXiv AI
2026-04-20 04:00
翻译成中文
通过蒙特卡罗树搜索对智能体技能进行双层优化
优化
组件
结构
双层
textttskill
arXiv:2604.15709v1 公告类型:新 摘要:智能体\texttt{技能}是指令、工具和支持资源的结构化集合,可帮助大型语言模型(LLM)智能体执行特定类别的任务。经验证据表明,\texttt{skills} 的设计可以对代理任务性能产生重大影响,但系统地优化 \texttt{skills} 仍然具有挑战性。由于技能以结构化方式包含指令、工具和支持资源,因此对其进行优化需要共同确定这些组件的结构以及每个组件包含的内容。这产生了一个复杂的决策空间,其结构和组件之间具有很强的相互依赖性。因此,我们将这两个耦合决策表示为 \texttt{skill} 结构和组件内容,并将 \texttt{skill} 优化制定为双层优化问题。我们提出了一个双层优化框架,其中外循环采用蒙特卡罗树搜索来确定 \texttt{skill} 结构,而内循环则细化外循环选择的结构内的组件内容。在这两个循环中,我们都使用 LLM 来协助优化过程。我们在开源运筹学问答数据集上评估了所提出的框架,实验结果表明,双层优化框架通过优化的 \texttt{skill} 提高了代理的性能。
查看原始链接
相关文章推荐
通过代数不变量为法学硕士进行结构化溯因-演绎-归纳推理
2026-04-20
LLM推理是潜在的,而不是思想链
2026-04-20
世界泄露了未来:利用进化来预测未来
2026-04-20
返回首页