AI Insight Hub - 最新人工智能动态

arXiv:2606.30911v1 公告类型：新摘要：机器学习工程代理浪费计算资源来重新发现已知技术，因为每次比赛都是冷启动。我们提出了 HASTE，一个分层的多代理系统，它将交叉竞争知识组织成三个范围层（全局、领域和特定于竞争的），每个层都耦合到一个匹配的代理级别。协调者协调领域专家，并通过法学硕士驱动的抽象促进各层之间的学习。受控消融为范围加载提供了证据：在 8 场比赛中保持 159 个技能库存不变，分层加载实现 100% 的奖牌率，而扁平加载仅达到 62.5%，与不加载技能相同的奖牌率，并消耗 2 倍的输出代币。在完整的 MLE-Bench Lite 基准测试（22 场 Kaggle 比赛）上，HASTE 使用 Claude Sonnet 4.6 在每场比赛 12 小时内达到了 77.3% 的奖牌率。在冷启动运行中，系统开始时没有积累技能。在热启动运行中，它会重新加载从早期比赛中学到的技能，仅使用全局和领域级技能进行跨比赛转移。热启动使用的细化迭代减少了 52%，一旦有 50 多种技能可用，代理保留的建议变更比例就会从低库存时的 42% 上升到 85%。这些结果表明，更好的知识组织可以部分替代 ML 工程代理中的模型强度和计算预算。

为什么要解决两次？高效迁移机器学习工程的技能分层积累

相关文章推荐

多跳 LLM 代理的持久潜在内存：6G 切换论文如何关闭代理冷启动

法学硕士陷入了集体思维的困境。这家初创公司正试图将他们赶出去。

当内存成为数据工程新瓶颈时我们该怎么办？