-
GitHub_Source_公共代码仓库相似分组数据集_2016
2026年1月28日 30 131 4
数据集概述 本数据集包含2016年10月的公共GitHub仓库相似分组数据,采用加权Jaccard相似度(阈值0.8~0.9)将高度相似的仓库分为多个组。数据格式为JSON,整体结构为列表嵌套列表,每个内层列表对应一组相似仓库。 文件详解 文件名称:github_duplicates.json 文件格式:JSON...
-
npm_Maven_Based软件开发依赖包数据
2026年2月1日 30 23 18
数据集概述 本数据集包含npm和Maven两种开发工具的依赖包及其版本发布列表,共包含四个压缩文件,无目录结构,所有文件均为压缩格式,未包含说明文档或内容预览。 文件详解 文件名称:npm_versions.zip 文件格式:ZIP 字段映射介绍:未提供具体字段信息,推测包含npm包的版本发布列表相关数据...
-
NPM_10k_packages_版本时间戳与依赖关系数据
2026年1月30日 30 24 0
数据集概述 本数据集包含一万个NPM包的版本信息,每个版本记录了发布时间戳及依赖关系。数据以结构化格式存储,核心内容为NPM包的名称、各版本对应的时间戳和依赖项,为软件供应链分析提供基础数据支撑。 文件详解 文件名称:processed.json 文件格式:JSON 字段映射介绍: name:NPM包名称(如"react")...
-
Python_Reinforcement_Learning_GitHub开源仓库数据_软件工程质量分析
2026年1月2日 30 133 3
数据集概述 本数据集包含基于GitHub开源仓库提取的Python强化学习项目,选取了星标量前20的活跃仓库,用于结合软件工程质量指标进行分析。数据以压缩包形式提供,可支持对强化学习开源项目的质量评估和特征研究。 文件详解 文件名称:RepositoriesPython.zip 文件格式:ZIP...
-
Apache_Eclipse_基金会_Based_OSSPREY开源项目数据完整数据集
2025年12月12日 30 50 31
数据集概述 本数据集包含与Apache和Eclipse基金会相关的OSSPREY项目数据,以压缩文件形式存储,未提供具体内容描述,为相关开源项目研究提供基础数据支持。 文件详解 文件名称: mongo_exports.zip 文件格式: ZIP压缩包(.zip) 内容说明: 未提供文件内容预览,推测为MongoDB导出的相关数据压缩文件 适用场景...
-
Fedora与Debian软件包依赖网络及节点描述文本数据集
2025年12月9日 30 107 75
数据集概述 该数据集包含Fedora(28版)和Debian(9.5版)的软件包依赖网络数据,以及节点关联的描述文本,同时收录了基于PCTADW-*方法生成的学习向量,为软件依赖关系分析提供支持。 文件详解 文件名称:package-dependency-networks.zip 文件格式:ZIP压缩包 内容说明:压缩包内包含Fedora...
-
第三方库选择的从业者视角数据集
2025年12月9日 30 87 18
数据集概述 本数据集围绕第三方库选择的从业者视角展开,包含调查数据、分析代码及相关文档,为研究软件从业者在第三方库选择决策中的考量因素提供数据支持。 文件详解 该数据集由多种类型文件组成,具体说明如下: - 数据文件(CSV格式): - pt.csv:包含调查原始数据,字段涵盖Response ID、Time Started、Date...
-
开源代码库中EMF元模型重复分析数据集
2025年12月5日 30 44 11
数据集概述 该数据集围绕开源代码库中EMF元模型的重复现象展开分析,包含一个压缩格式的文件,为研究元模型复用与冗余问题提供数据支持。 文件详解 文件名称: data-paper.zip 文件格式: ZIP压缩文件 内容说明: 压缩包内可能包含与EMF元模型重复分析相关的原始数据、研究论文或支撑文档,具体内容需解压后查看 适用场景 软件工程研究:...



