AI Insight Hub
图片转PPT
Image2PPT
图片转PPT神器
首页
分类
关于
管理后台
首页
分类
关于
管理后台
来源:ArXiv AI
2026-07-01 04:00
翻译成中文
为什么要解决两次?高效迁移机器学习工程的技能分层积累
技能
比赛
代理
加载
学习
arXiv:2606.30911v1 公告类型:新 摘要:机器学习工程代理浪费计算资源来重新发现已知技术,因为每次比赛都是冷启动。我们提出了 HASTE,一个分层的多代理系统,它将交叉竞争知识组织成三个范围层(全局、领域和特定于竞争的),每个层都耦合到一个匹配的代理级别。协调者协调领域专家,并通过法学硕士驱动的抽象促进各层之间的学习。受控消融为范围加载提供了证据:在 8 场比赛中保持 159 个技能库存不变,分层加载实现 100% 的奖牌率,而扁平加载仅达到 62.5%,与不加载技能相同的奖牌率,并消耗 2 倍的输出代币。在完整的 MLE-Bench Lite 基准测试(22 场 Kaggle 比赛)上,HASTE 使用 Claude Sonnet 4.6 在每场比赛 12 小时内达到了 77.3% 的奖牌率。在冷启动运行中,系统开始时没有积累技能。在热启动运行中,它会重新加载从早期比赛中学到的技能,仅使用全局和领域级技能进行跨比赛转移。热启动使用的细化迭代减少了 52%,一旦有 50 多种技能可用,代理保留的建议变更比例就会从低库存时的 42% 上升到 85%。这些结果表明,更好的知识组织可以部分替代 ML 工程代理中的模型强度和计算预算。
查看原始链接
相关文章推荐
多跳 LLM 代理的持久潜在内存:6G 切换论文如何关闭代理冷启动
2026-07-01
法学硕士陷入了集体思维的困境。这家初创公司正试图将他们赶出去。
2026-07-01
当内存成为数据工程新瓶颈时我们该怎么办?
2026-07-01
返回首页