AI Insight Hub - 最新人工智能动态

arXiv:2601.00848v1 公告类型：新摘要：我们提出了一种公开记录的方法，用于微调语言模型，以使用 OpenTelemetry 跟踪分析来检测多代理 AI 工作流程中的时间攻击模式。我们整理了来自 18 个公共网络安全来源的 80,851 个示例和 35,026 个合成 OpenTelemetry 跟踪的数据集。我们通过具有战略增强的三个训练迭代，在资源受限的 ARM64 硬件 (NVIDIA DGX Spark) 上应用迭代 QLoRA 微调。我们的自定义基准测试准确度从 42.86% 提高到 74.29%，统计上显着提高了 31.4 个百分点。解决特定知识差距的有针对性的示例胜过不加区别的扩展。主要贡献包括：(1) 用于多智能体协调攻击和监管违规的合成跟踪生成方法，(2) 训练数据组成从根本上决定行为的经验证据，以及 (3) 在 HuggingFace 上完全公开发布数据集、训练脚本和评估基准。虽然由于误报率，实际部署需要人工监督，但这项工作建立了第一个可重复的框架，使从业者能够构建适合其威胁环境的自定义代理安全模型。

多代理 AI 工作流程中的时态攻击模式检测：用于训练基于跟踪的安全模型的开放框架

相关文章推荐

当 Shapley 值被打破时：稳健模型可解释性指南

Amazon AMET Payments 团队如何使用 Strands Agents 加速测试用例生成

使用 Amazon Bedrock 构建由 AI 驱动的生成式业务报告解决方案