AI背景

探索人工智能的无限可能

每日更新全球最新AI动态、研究进展和技术应用,让您紧跟人工智能发展前沿

AI装饰图

热门分类

查看全部

最新资讯

AI21 的 Jamba Reasoning 3B 重新定义了法学硕士中“小”的含义——笔记本电脑上的 250K 上下文
VentureBeat AI
模型 设备 可以 推理 Jamba

AI21 的 Jamba Reasoning 3B 重新定义了法学硕士中“小”的含义——笔记本电脑上的 250K 上下文

企业小型模型浪潮的最新成员来自AI21 Labs,该实验室坚信将模型引入设备将释放数据中心的流量。AI21 的 Jamba Reasoning 3B,是一个微型开源模型,可以运行扩展推理代码生成并根据真实情况进行响应。AI21 联合首席执行官 Ori Goshen 告诉 VentureBeat,该公司看到了更多小型模型的企业用例,主要是因为将大部分推理转移到设备上可以释放数据中心。Goshen 表示,他们的模型提供的最大区别在于,它比大多数模型还要小,但它可以在不牺牲速度的情况下运行推理任务。Goshen 表示,像 Jamba Reasoning 3B 这样的小型模型的另一个优点是它们具有高度...

2025-10-08 阅读全文
大型语言模型智能体行为智能的结构化认知:初步研究 - 自然语言处理 大型语言模型智能体行为智能的结构化认知:初步研究 - 计算机视觉 大型语言模型智能体行为智能的结构化认知:初步研究 - AIGC 大型语言模型智能体行为智能的结构化认知:初步研究 - 强化学习 大型语言模型智能体行为智能的结构化认知:初步研究 - 大模型 大型语言模型智能体行为智能的结构化认知:初步研究
ArXiv AI
模型 SCL 语言 认知 任务

大型语言模型智能体行为智能的结构化认知:初步研究

05107v1 公告类型新 摘要大型语言模型具有先进的自然语言理解和生成能力,但它们作为自主代理的使用给多步骤任务带来了架构挑战。我们根据基于提示的基线包括 ReAct 和通用 LangChain 代理在三个场景中评估 SCL基于温度的旅行计划带条件发送的电子邮件起草以及约束引导的图像生成。这些发现是初步的,旨在指导更多模型更长视野多模式任务和协作环境的扩展研究

2025-10-08 阅读全文
Lang-PINN:通过多代理框架从语言到物理信息神经网络 - 自然语言处理 Lang-PINN:通过多代理框架从语言到物理信息神经网络 - AIGC Lang-PINN:通过多代理框架从语言到物理信息神经网络 - 强化学习 Lang-PINN:通过多代理框架从语言到物理信息神经网络 - 大模型 Lang-PINN:通过多代理框架从语言到物理信息神经网络
ArXiv AI
PINN 代理 微分方程 PDE 架构

Lang-PINN:通过多代理框架从语言到物理信息神经网络

05158v1 公告类型新 摘要物理信息神经网络PINN为求解偏微分方程PDE提供了一种强大的方法,但构建可用的 PINN 仍然是劳动密集型且容易出错。LangPINN 协调四个互补代理将任务描述解析为符号 PDE 的 PDE 代理选择架构的 PINN 代理生成模块化实现的代码代理以及执行和诊断迭代细化错误的反馈代理。实验表明,与竞争基线相比,LangPINN 实现了显着更低的错误和更高的鲁棒性均方误差 MSE 降低了多达 35 个数量级,端到端执行成功率提高了 50 以上,时间开销减少了多达 74

2025-10-08 阅读全文
即插即用的剧作家:通过协作法学硕士代理进行迭代叙事脚本细化的分而治之方法 - AIGC 即插即用的剧作家:通过协作法学硕士代理进行迭代叙事脚本细化的分而治之方法 - 强化学习 即插即用的剧作家:通过协作法学硕士代理进行迭代叙事脚本细化的分而治之方法 - 大模型 即插即用的剧作家:通过协作法学硕士代理进行迭代叙事脚本细化的分而治之方法
ArXiv AI
方法 修改 法学硕士 叙事 问题

即插即用的剧作家:通过协作法学硕士代理进行迭代叙事脚本细化的分而治之方法

05188v1 公告类型新 摘要虽然法学硕士已被广泛应用于创意内容生成,但单遍过程往往难以产生高质量的长篇叙事。如何像编剧一样有效地修改和完善长篇叙事剧本,仍然是一个重大挑战,因为它需要全面了解整个脉络,找出全局结构性问题和局部细节缺陷,并协调多粒度多地点的修改。它包括一个全局审查阶段,用于掌握整体故事情节和结构问题一个场景级审查阶段,用于查明详细的场景和句子缺陷以及一个层次协调修订阶段,用于协调和整合整个剧本的结构和细节改进

2025-10-08 阅读全文
OneFlow:并发混合模式和交错生成编辑流量 - 机器学习 OneFlow:并发混合模式和交错生成编辑流量 - 计算机视觉 OneFlow:并发混合模式和交错生成编辑流量 - AIGC OneFlow:并发混合模式和交错生成编辑流量
ArXiv AI
OneFlow 并发 生成 回旋 模型

OneFlow:并发混合模式和交错生成编辑流量

03506V1公告类型新 摘要我们提出了OneFlow,这是第一个非自动回旋多模型,可实现可变长度和并发的混合模式生成。与在文本和图像生成之间执行刚性因果关系的自回旋模型不同,OneFlow结合了基于插入的编辑流程,用于离散文本令牌和图像潜在的流量匹配。通过从1B到8B的模型尺寸进行的对照实验,我们证明,OneFlow在生成和理解任务上都超过了自回归基准,同时消耗了多达50的训练拖鞋

2025-10-07 阅读全文
用AI代替编码器?为什么比尔·盖茨(Bill Gates),山姆·奥特曼(Sam Altman)和经验说你不应该
VentureBeat AI
AI 工作 数据 代码 人类

用AI代替编码器?为什么比尔·盖茨(Bill Gates),山姆·奥特曼(Sam Altman)和经验说你不应该

叙述是诱人的可以编写整个应用程序,简化工程团队并减少对昂贵人类开发人员的需求的AI工具以及数百个工作。我已经与通用电气,沃尔特迪斯尼公司和哈佛医学院等行业领导者合作,以优化他们的数据和AI基础设施,这就是我学到的在大多数工作中用AI代替人类仍然只是一个想法。马克扎克伯格Mark Zuckerberg 他计划用Meta的coders of Meta ais Ai ais Ai ais Ai ais Ai ais Ais Ais Ais Ais Ai。生成的AI模型在大型数据集中受过培训,这些数据集均在两个主要类别上通常属于公开可用的数据从开放的互联网,或从组织中或购买第三部分或购买的第三部分。我...

2025-10-05 阅读全文
基准分析:LLM基准的机理诊断 - AIGC 基准分析:LLM基准的机理诊断 - 强化学习 基准分析:LLM基准的机理诊断 - 大模型 基准分析:LLM基准的机理诊断
ArXiv AI
基准 能力 分析 模型 benchmarks

基准分析:LLM基准的机理诊断

01232V1公告类型交叉 摘要大型语言模型通常是根据标准基准分数来判断的,但是这样的分数通常夸大了真正的能力,因为它们掩盖了任务实际上需要的技能。Profiling three instructiontuned models across ten widely used benchmarks yields four key findings i most benchmarks draw on several abilities rather than one, ii datasets with similar labels rely on distinct ability mixtures,...

2025-10-03 阅读全文
pur捕:矢量定量图像生成的变分流匹配 - 机器学习 pur捕:矢量定量图像生成的变分流匹配 - 计算机视觉 pur捕:矢量定量图像生成的变分流匹配 - AIGC pur捕:矢量定量图像生成的变分流匹配
ArXiv AI
匹配 潜在 定量 生成 方法

pur捕:矢量定量图像生成的变分流匹配

01478V1公告类型交叉 摘要我们介绍了Purrception,这是矢量定量图像生成的变分流匹配方法,可提供明确的分类监督,同时保持连续的运输动力学。我们的方法通过在计算连续嵌入空间中计算速度字段时,通过学习分类后代来调整各种流量匹配到矢量定量的潜在潜在的潜在潜在的潜在。这表明,变分流匹配可以有效地弥合连续运输和离散监督,以提高图像产生的训练效率

2025-10-03 阅读全文
无监督的动态功能选择视觉任务中强大的潜在空间 - 机器学习 无监督的动态功能选择视觉任务中强大的潜在空间 - 计算机视觉 无监督的动态功能选择视觉任务中强大的潜在空间 - AIGC 无监督的动态功能选择视觉任务中强大的潜在空间
ArXiv AI
监督 潜在 任务 表示 模型

无监督的动态功能选择视觉任务中强大的潜在空间

01758V1公告类型交叉 摘要潜在表示对机器学习模型的性能和鲁棒性至关重要,因为它们以紧凑而有益的方式编码数据的基本特征。通过利用无监督的框架,我们的方法避免了对标记数据的依赖,从而广泛适用于各个域和数据集。在图像数据集上进行的实验表明,配备了无监督DFS的模型在各种任务包括聚类和图像生成上的泛化性能方面取得了重大改进,同时导致计算成本的最小增加

2025-10-03 阅读全文
打包和强迫您的记忆:长形式和一致的视频生成 - 机器学习 打包和强迫您的记忆:长形式和一致的视频生成 - AIGC 打包和强迫您的记忆:长形式和一致的视频生成 - 强化学习 打包和强迫您的记忆:长形式和一致的视频生成 - 大模型 打包和强迫您的记忆:长形式和一致的视频生成
ArXiv AI
视频 强迫 生成 长期 上下文

打包和强迫您的记忆:长形式和一致的视频生成

01784V1公告类型交叉 摘要长格式视频生成提出了双重挑战模型必须捕获长期依赖性,同时防止自回旋解码中固有的误差积累。首先,对于动态上下文建模,我们提出了MemoryPack,MemoryPack是一种可学习的上下文 回归机制,它利用文本和图像信息作为全局指导,以共同对短期和长期依赖性建模,实现分钟级的时间一致性。Memory Pack和Direct强迫共同提高了长期视频生成的上下文一致性和可靠性,从而提高了自动回归视频模型的实际可用性

2025-10-03 阅读全文

不错过任何AI前沿动态

订阅我们的通讯,每周精选AI领域最重要的研究和应用进展直接发送到您的邮箱

我们尊重您的隐私,绝不会向第三方分享您的信息

关于AI Insight Hub

AI Insight Hub是一个致力于为AI研究者、开发者和爱好者提供最新、最全面的人工智能领域资讯的平台。我们通过先进的内容采集和处理技术,每日自动从全球各大AI研究机构、科技博客和新闻网站收集高质量的内容,并利用大语言模型为您提供专业的摘要和关键词。

我们的目标是帮助您在这个快速发展的领域中保持领先,不错过任何重要的研究突破和技术应用。

每日更新

及时获取最新资讯

智能筛选

优质内容精选

我们的数据源

  • OpenAI Blog
  • Google AI Blog
  • MIT Technology Review
  • ArXiv AI
  • DeepMind Blog
  • AI Trends
  • VentureBeat AI