AI Insight Hub - 最新人工智能动态

使用视觉+语言模型来预测项目难度

项目使用视觉模型预测

arXiv:2603.04670v1 公告类型：新摘要：该项目研究了大型语言模型（LLM）确定数据可视化素养测试项目难度的能力。我们探讨从项目文本（问题和答案选项）、可视化图像或两者的组合派生的特征是否可以预测美国成年人的项目难度（正确答案的比例）。我们使用 GPT-4.1-nano 来分析项目并根据这些不同的特征集生成预测。同时使用视觉和文本特征的多模态方法产生最低的平均绝对误差 (MAE) (0.224)，优于单模态仅视觉 (0.282) 和仅文本 (0.338) 方法。表现最佳的多模态模型应用于外部评估的保留测试集，并实现了 0.10805 的均方误差，证明了法学硕士在心理测量分析和自动化项目开发方面的潜力。