来源:ArXiv AI 2025-10-16 04:00

通过目标驱动的学习者状态建模进行个性化学习路径规划

学习 目标 个性化 路径 驱动
arXiv:2510.13215v1 公告类型:新 摘要:个性化学习路径规划(PLPP)旨在设计符合个人目标的自适应学习路径。虽然大型语言模型 (LLM) 在个性化学习体验方面显示出潜力,但现有方法通常缺乏目标一致的规划机制。我们推出 Pxplore,这是一种新颖的 PLPP 框架,它集成了基于强化的培训范式和法学硕士驱动的教育架构。我们设计了一个结构化的学习者状态模型和一个自动奖励函数,将抽象目标转换为可计算的信号。我们结合监督微调(SFT)和组相对策略优化(GRPO)来训练策略,并将其部署在现实世界的学习平台中。大量实验验证了 Pxplore 在生成连贯、个性化和目标驱动的学习路径方面的有效性。我们发布代码和数据集以促进未来的研究。

相关文章推荐

返回首页