AI Insight Hub - 最新人工智能动态

arXiv:2604.08863v1 公告类型：新摘要：从视觉观察中恢复物理场的分析解是人工智能辅助科学推理的一项基本但尚未充分开发的能力。我们研究二维线性稳态场的视觉到符号分析解推理（ViSA）：给定场可视化（和一阶导数）加上最小的辅助元数据，模型必须输出具有完全实例化的数值常量的单个可执行 SymPy 表达式。我们引入了 ViSA-R2，并将其与自我验证、以解决方案为中心的思想链管道结合起来，该管道遵循类似物理学家的路径：结构模式识别解决方案族（ansatz）假设参数推导一致性验证。我们还发布了 ViSA-Bench，这是一个 VLM 就绪的综合基准，涵盖 30 个线性稳态场景，具有可验证的分析/符号注释，并通过数值准确性、表达结构相似性和字符级准确性来评估预测。 ViSA-R2 使用 8B 开放权重 Qwen3-VL 主干网，其性能优于强大的开源基线以及标准化协议下评估的闭源前沿 VLM。

隐藏在显而易见的地方：从现场可视化中进行视觉到符号分析解决方案的推断

相关文章推荐

如何将克劳德代码应用于非技术任务

如何使用 AWS Lambda 构建有效的奖励函数以进行 Amazon Nova 模型定制

为什么对人工智能的看法如此分歧