来源:ArXiv AI 2025-10-10 04:00

L2M-AID:通过融合大型语言模型的语义推理与多智能体强化学习来实现自主网络物理防御(预印本)

学习 物理 代理 语义 智能
arXiv:2510.07363v1 公告类型:新 摘要:工业物联网 (IIoT) 的日益集成使关键的网络物理系统面临复杂的多阶段攻击,这些攻击避开了缺乏上下文感知的传统防御措施。本文介绍了 L2M-AID,这是一种使用 LLM 授权的多智能体强化学习的自主工业防御的新型框架。 L2M-AID 协调一组协作代理,每个代理均由大型语言模型 (LLM) 驱动,以实现自适应和弹性安全。核心创新在于两种人工智能范式的深度融合:我们利用法学硕士作为语义桥梁,将大量的、非结构化的遥测数据转化为丰富的上下文状态表示,使代理能够推理对手的意图,而不仅仅是匹配模式。这种语义感知状态使多智能体强化学习 (MARL) 算法 MAPPO 能够学习复杂的合作策略。 MARL 奖励功能经过独特设计,旨在平衡安全目标(威胁中和)与操作要求,明确惩罚破坏物理过程稳定性的行为。为了验证我们的方法,我们对基准 SWaT 数据集和基于 MITRE ATT&CK for ICS 框架生成的新颖合成数据集进行了广泛的实验。结果表明,L2M-AID 在关键指标上显着优于传统 IDS、深度学习异常检测器和单代理 RL 基线,实现了 97.2% 的检测率,同时将误报减少了 80% 以上,并将响应时间缩短了四倍。至关重要的是,它在维持物理过程稳定性方面表现出了卓越的性能,为保护关键的国家基础设施提供了强大的新范例。

相关文章推荐

返回首页