-
PyPI_Annotated_PyPI包依赖图及元数据归档数据
2026年2月9日 30 115 65
数据集概述 本数据集以有向图形式呈现PyPI包数据,包含软件依赖关系及包元数据。依赖关系通过有向边表示,元数据涵盖发布日期、下载量等信息。数据集为单一压缩文件,无目录结构,可用于分析Python软件包的依赖网络结构。 文件详解 文件名称:pypi-dependency-graph-0.1.zip 文件格式:ZIP...
-
NPM_Based_NPM包可复现性研究数据集
2026年2月1日 30 84 78
数据集概述 本数据集为开源数据集,包含通过工具链构建的NPM包相关数据,涵盖diffoscope输出、工具链构建版本及npmjs注册表中的预构建包,共5个文件,用于研究NPM包的可复现性。 文件详解 压缩文件 文件名称:source-code-dataset-collection.zip 文件格式:ZIP 字段映射介绍:包含源代码数据集相关压缩内容...
-
NPM_10k_packages_版本时间戳与依赖关系数据
2026年1月30日 30 44 0
数据集概述 本数据集包含一万个NPM包的版本信息,每个版本记录了发布时间戳及依赖关系。数据以结构化格式存储,核心内容为NPM包的名称、各版本对应的时间戳和依赖项,为软件供应链分析提供基础数据支撑。 文件详解 文件名称:processed.json 文件格式:JSON 字段映射介绍: name:NPM包名称(如"react")...
-
Rust_Based_开源生态系统安全风险分析数据集_全量
2026年1月30日 30 63 29
数据集概述 本数据集包含crates.io平台84,105个Rust包的元数据、433个已报告漏洞、300个存在漏洞的代码仓库及218个漏洞修复提交记录,时间跨度达7年,用于分析Rust生态系统的安全风险状况,为开源软件安全研究提供基础数据支持。 文件详解 文件名称:dataset-Rust-packages-and-...
-
NPM_Ecosystem_Based_技术杠杆机会与安全风险复制研究数据集
2026年1月20日 30 81 28
数据集概述 本数据集为论文“Opportunities and Security Risks of Technical Leverage: A Replication Study on the NPM Ecosystem”的复制包,包含14,042个稳定版本的元数据、技术杠杆数据及漏洞报告,支持复现研究的全流程分析,共4个文件。 文件详解...
-
nss2024_Based_软件供应链拼写劫持包检测与缓解数据集_v1_0_0
2026年1月20日 30 23 7
数据集概述 本数据集聚焦软件供应链中的拼写劫持包检测,包含研究者收集的拼写劫持包数据集、Backstabbers Knife Collection快照、MalOSS数据集快照及相关源代码(含随机森林模型和扩展Damerau-Levenshtein算法),用于评估拼写劫持检测算法性能,提升软件供应链恶意软件防护能力。 文件详解...
-
SANER2019_基于过时Docker容器的严重漏洞与软件缺陷之间的关联性研究_复制包数据
2026年1月12日 30 198 142
数据集概述 本数据集是SANER2019会议收录论文的复制包,对应研究主题为过时Docker容器与严重漏洞、缺陷的关系。复制包包含分析所需的笔记本、预处理数据及辅助脚本,支持复现论文中的分析结果,可用于Docker容器安全相关研究与验证。 文件详解 主文件:Replication_Package_Docker.zip 文件格式:ZIP 内容结构:...
-
Tracing_Vulnerabilities_Maven依赖网络与CVE生命周期研究结果数据
2026年1月12日 30 162 161
数据集概述 本数据集为Maven漏洞追踪研究的结果数据,聚焦于Maven生态系统中的CVE生命周期及依赖网络分析。数据集包含一个压缩文件,未划分训练/测试集、数据/标签集或原始/处理数据集,无自述文件或内容预览,用于支持软件供应链安全领域的相关研究。 文件详解 文件名称:data.zip 文件格式:ZIP...
-
数据3dPartyPackages_Docker_Based_DockerHub镜像第三方软件包研究数据
2026年1月1日 30 25 1
数据集概述 本数据集是DockerHub社区镜像中第三方JavaScript、Python和Ruby软件包研究的复现包,包含镜像内安装的第三方软件包相关数据,可用于分析Docker镜像中的第三方依赖情况,支持软件供应链安全等研究,数据集仅有一个压缩文件。 文件详解 文件名称:data.zip 文件格式:ZIP...
-
MSR2024_GitHub_Workflows可复用JavaScript_Actions安全问题量化研究数据
2025年12月28日 30 23 10
数据集概述 本数据集是MSR 2024会议论文《Quantifying Security Issues in Reusable JavaScript Actions in GitHub Workflows》的复现包,包含复现研究分析所需的全部材料,涵盖GitHub Workflows中可复用JavaScript...
-
Helm图表安全配置错误分析与大语言模型缓解数据集2024
2025年12月11日 30 197 142
数据集概述 该数据集包含2024年6月从Artifact Hub下载的Helm图表模板,以及通过Checkov、KICS等工具分析得到的安全配置错误结果,还包括大语言模型(LLMs)生成的缓解建议CSV文件和人工分析片段,为研究Helm图表安全配置问题提供支持。 文件详解 文件名称: Static Checks - Mapping.pdf 文件格式:...
-
AI代码生成器隐秘数据投毒攻击检测_PoisonPy扩展数据集
2025年12月10日 30 175 51
数据集概述 该数据集是论文《Detecting Stealthy Data Poisoning Attacks in AI Code Generators》的配套数据,已被2025年第三届IEEE软件工程可靠与安全人工智能研讨会(ReSAISE...
-
自动驾驶相关开源项目SBOM数据集2025
2025年12月6日 30 113 66
数据集概述 本数据集包含2025年2月25日从530个公共GitHub仓库源代码生成的SPDX兼容软件物料清单(SBOMs),聚焦自动驾驶相关软件,采用与Kochanthara等人编译汽车软件数据集相似的方法,为自动驾驶软件供应链分析提供数据支持。 文件详解 文件名称: autopilot_sbom_data.zip 文件格式: ZIP (.zip)...



