我们很高兴地宣布,DataCon 2025 大数据安全分析竞赛的“漏洞攻击流量识别”赛题数据即将正式开放下载。该数据集包含带有 CVE 标签的真实 HTTP 流量,旨在为漏洞检测和网络安全领域的研究人员与开发者提供高质量的资源。
背景介绍
随着网络安全威胁日益严峻,及时识别并响应漏洞攻击已成为网络防御的关键。HTTP 流量作为网络通信的主要载体,承载着海量应用数据与潜在的安全风险。通过深入分析 HTTP 流量中的攻击行为,可以有效提升网络空间的整体防御能力。
然而,当前公开的网络流量数据集大多聚焦于 DDoS/XSS 等通用攻击类型识别、Stream/P2P 等协议类型识别或 Gmail/Skype 等服务类型识别。专门针对特定 CVE 漏洞攻击的 HTTP 流量数据集仍较为匮乏。本数据集旨在填补这一空白,推动相关技术的发展。
数据集描述
数据集分为训练集和测试集,分别存储于以下两个文件中:
* train.json.gz: 训练集数据
* test.json.gz: