探索人工智能的无限可能

每日更新全球最新AI动态、研究进展和技术应用，让您紧跟人工智能发展前沿

浏览最新资讯按分类查看

最新资讯

AI Alignment Forum

of the and to for

通过分析成绩单确保药物安全评估

In this update, we share preliminary results from analysing transcripts of agent activity that may be of interest to nbspresearchers working in the field。78nbspA transcript is the log that details an agents activity on the task it contains the initial task instruction, the models commentary and reas...

2025-10-10 阅读全文

L2M-AID：通过融合大型语言模型的语义推理与多智能体强化学习来实现自主网络物理防御（预印本） - 机器学习

L2M-AID：通过融合大型语言模型的语义推理与多智能体强化学习来实现自主网络物理防御（预印本） - 自然语言处理

L2M-AID：通过融合大型语言模型的语义推理与多智能体强化学习来实现自主网络物理防御（预印本） - 强化学习

L2M-AID：通过融合大型语言模型的语义推理与多智能体强化学习来实现自主网络物理防御（预印本） - 大模型

L2M-AID：通过融合大型语言模型的语义推理与多智能体强化学习来实现自主网络物理防御（预印本）

ArXiv AI

学习物理代理语义智能

L2M-AID：通过融合大型语言模型的语义推理与多智能体强化学习来实现自主网络物理防御（预印本）

07363v1 公告类型新摘要工业物联网 IIoT 的日益集成使关键的网络物理系统面临复杂的多阶段攻击,这些攻击避开了缺乏上下文感知的传统防御措施。核心创新在于两种人工智能范式的深度融合我们利用法学硕士作为语义桥梁,将大量的非结构化的遥测数据转化为丰富的上下文状态表示,使代理能够推理对手的意图,而不仅仅是匹配模式。至关重要的是,它在维持物理过程稳定性方面表现出了卓越的性能,为保护关键的国家基础设施提供了强大的新范例

2025-10-10 阅读全文

ArXiv AI

模型推理思维基础性能

基础模型知道如何推理，思维模型知道何时学习

在这项工作中,我们提出了一种混合模型,在适当的时间激活基础模型中的推理机制,以引出思维模型级推理链,这意味着思维模型利用已有的能力。在三个基本模型和四个思维模型中,使用 GSM8K 和 MATH500,我们的混合模型在没有任何权重更新的情况下恢复了与思维模型高达 91 的性能差距,同时仅控制 12 的代币。更广泛地说,这些结果重新构建了我们对思维模型如何训练的理解预训练是模型获得大部分推理机制的时候,而后训练则教导在正确的时间有效部署这些机制,从而能够有效地利用其推理时间计算

2025-10-10 阅读全文

ArXiv AI

代理 ProSEA 通过任务计划

ProSEA：通过勘探代理解决问题

ProSEA 采用分层架构,其中管理器代理协调领域专用的专家代理分解任务并根据失败尝试的结构化反馈自适应地重新计划。与之前的系统不同,ProSEA 代理不仅报告成功或失败,还报告失败的详细原因和新发现的约束,从而通过探索性跟踪实现动态计划细化。在具有挑战性的 FinanceBench 基准上进行的实验表明,即使没有人类反馈,ProSEA 的性能也优于最先进的基准,并在推理繁重的任务中实现了稳健的性能

2025-10-10 阅读全文

ArXiv AI

序列推理时间代理迭代

TS-Agent：具有迭代统计洞察收集功能的时间序列推理代理

07432v1 公告类型新摘要大型语言模型LLM在推理和解决问题方面表现出了强大的能力,但最近的研究表明它们仍然难以应对时间序列推理任务,其输出经常受到幻觉或知识泄漏的影响。在这项工作中,我们提出了 TSAgent,一种时间序列推理代理,它严格利用法学硕士的优势,即收集证据并通过逐步推理将其合成结论,同时将统计和结构信息的提取委托给时间序列分析工具。我们的代理不是将时间序列映射到文本标记图像或嵌入中,而是通过原子运算符与原始数字序列进行交互,在显式证据日志中记录输出,并在自我批评和最终质量门的指导下迭代地完善其推理

2025-10-10 阅读全文

ExpertAgent：通过动态规划和检索增强长链推理增强个性化教育 - 自然语言处理

ExpertAgent：通过动态规划和检索增强长链推理增强个性化教育 - 强化学习

ExpertAgent：通过动态规划和检索增强长链推理增强个性化教育 - 大模型

ArXiv AI

学习 ExpertAgent 个性化教育内容

ExpertAgent：通过动态规划和检索增强长链推理增强个性化教育

为了应对这些挑战,我们提出了 ExpertAgent一种专为个性化教育而设计的智能代理框架,可提供可靠的知识并实现高度自适应的学习体验。因此,我们开发了ExpertAgent,一种创新的学习代理,为用户提供主动且个性化的学习体验。因此,克服传统静态学习内容的局限性,实时提供优化的教学策略和学习体验

2025-10-10 阅读全文

ArXiv AI

法学硕士模型流程分析优化

流程模型分析和优化的法学硕士评估

07489v1 公告类型新摘要在本文中,我们报告了我们与几位法学硕士的经验,因为他们能够以交互对话的方式理解流程模型,发现其中的句法和逻辑错误,并通过自然语言NL界面对其进行深入推理。我们的研究结果表明,像 ChatGPT模型 o3这样的普通未经训练的 LLM 在零样本设置中可以有效地从图像中理解 BPMN 流程模型,并在句法逻辑和语义深度级别智能地回答有关它们的查询。我们还研究法学硕士的思维过程以及在过程分析和优化的背景下进行更深入推理的能力

2025-10-10 阅读全文

AWS Machine Learning Blog

Nova 审核 Amazon 内容文本

使用 Amazon Nova 自定义文本内容审核

在这篇文章中,我们介绍了通过 Amazon SageMaker AI 进行文本内容审核的 Amazon Nova 定制,使组织能够根据其特定的审核需求微调模型。三个基准测试的评估结果显示,与基准 Nova Lite 相比,定制的 Nova 模型的 F1 分数平均提高了 7。3,在不同的内容审核任务中,个别改进范围为 4

2025-10-09 阅读全文

Thinking Machines Tinker API 对于人工智能控制和安全来说是个好消息 - 机器学习

Thinking Machines Tinker API 对于人工智能控制和安全来说是个好消息 - 自然语言处理

Thinking Machines Tinker API 对于人工智能控制和安全来说是个好消息 - 强化学习

Thinking Machines Tinker API 对于人工智能控制和安全来说是个好消息 - 大模型

Thinking Machines Tinker API 对于人工智能控制和安全来说是个好消息

AI Alignment Forum

the to and that of

Thinking Machines Tinker API 对于人工智能控制和安全来说是个好消息

But its more interesting to me for another reason the design of this API makes it possible to do many types of ML research without direct access to the model youre working with。That is, you provide some inputs, and function from model output to a scalar loss, and their server will run forward on the...

2025-10-09 阅读全文

AlphaApollo：将基础模型和专业工具编排成用于深度代理推理的自我进化系统 - 机器学习

AlphaApollo：将基础模型和专业工具编排成用于深度代理推理的自我进化系统 - 强化学习

AlphaApollo：将基础模型和专业工具编排成用于深度代理推理的自我进化系统 - 大模型

AlphaApollo：将基础模型和专业工具编排成用于深度代理推理的自我进化系统

ArXiv AI

工具模型 AlphaApollo 推理系统

AlphaApollo：将基础模型和专业工具编排成用于深度代理推理的自我进化系统

06261v1 公告类型新摘要我们提出了 AlphaApollo,一种自我进化的代理推理系统,旨在解决基础模型FM推理中的两个瓶颈有限的模型内在能力和不可靠的测试时间迭代。它将 i 计算工具带有数字和符号库的 Python和 ii 检索工具与任务相关的外部信息结合起来,以执行精确的计算和基本决策。工具使用分析表明,超过 80 的工具调用成功执行,并且始终优于非工具基线,从而提高了 FM 的能力上限

2025-10-09 阅读全文

关于AI Insight Hub

AI Insight Hub是一个致力于为AI研究者、开发者和爱好者提供最新、最全面的人工智能领域资讯的平台。我们通过先进的内容采集和处理技术，每日自动从全球各大AI研究机构、科技博客和新闻网站收集高质量的内容，并利用大语言模型为您提供专业的摘要和关键词。

我们的目标是帮助您在这个快速发展的领域中保持领先，不错过任何重要的研究突破和技术应用。

每日更新

及时获取最新资讯

智能筛选

优质内容精选

我们的数据源

OpenAI Blog
Google AI Blog
MIT Technology Review
ArXiv AI
DeepMind Blog
AI Trends
VentureBeat AI

查看更多数据源

探索人工智能的无限可能

热门分类

最新资讯

不错过任何AI前沿动态

关于AI Insight Hub

我们的数据源