AI Insight Hub
图片转PPT
Image2PPT
图片转PPT神器
首页
分类
关于
管理后台
首页
分类
关于
管理后台
来源:ArXiv AI
2026-01-07 05:00
翻译成中文
多代理 AI 工作流程中的时态攻击模式检测:用于训练基于跟踪的安全模型的开放框架
训练
跟踪
代理
工作
攻击
arXiv:2601.00848v1 公告类型:新 摘要:我们提出了一种公开记录的方法,用于微调语言模型,以使用 OpenTelemetry 跟踪分析来检测多代理 AI 工作流程中的时间攻击模式。我们整理了来自 18 个公共网络安全来源的 80,851 个示例和 35,026 个合成 OpenTelemetry 跟踪的数据集。我们通过具有战略增强的三个训练迭代,在资源受限的 ARM64 硬件 (NVIDIA DGX Spark) 上应用迭代 QLoRA 微调。我们的自定义基准测试准确度从 42.86% 提高到 74.29%,统计上显着提高了 31.4 个百分点。解决特定知识差距的有针对性的示例胜过不加区别的扩展。主要贡献包括:(1) 用于多智能体协调攻击和监管违规的合成跟踪生成方法,(2) 训练数据组成从根本上决定行为的经验证据,以及 (3) 在 HuggingFace 上完全公开发布数据集、训练脚本和评估基准。虽然由于误报率,实际部署需要人工监督,但这项工作建立了第一个可重复的框架,使从业者能够构建适合其威胁环境的自定义代理安全模型。
查看原始链接
相关文章推荐
当 Shapley 值被打破时:稳健模型可解释性指南
2026-01-15
Amazon AMET Payments 团队如何使用 Strands Agents 加速测试用例生成
2026-01-15
使用 Amazon Bedrock 构建由 AI 驱动的生成式业务报告解决方案
2026-01-15
返回首页