数据集概述
本数据集为MSR相关研究数据,包含8个文件,涵盖研究问题、调查问题、依赖模式摘要、作者信息及依赖关系等内容。文件类型以.xlsx为主(5个),辅以.csv文件(3个),无目录结构,未划分训练/测试、数据/标签或原始/处理数据集,可用于科研数据分析与研究问题验证。
文件详解
- 研究问题文件
- 文件名称:Research Question1.xlsx、Research Question2.xlsx、Research Question3.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含与MSR研究相关的具体问题及对应数据,具体字段未明确展示
- 调查问题文件
- 文件名称:Survey Question1.xlsx、Survey Question2.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含MSR研究相关的调查问题及数据,具体字段未明确展示
- 依赖模式摘要文件
- 文件名称:dependency_patterns_summery.csv
- 文件格式:CSV
- 字段映射介绍:包含pattern(模式)、pattern_size(模式大小)、support(支持度)、all_usage(总使用量)、percentage(百分比)、devs_count(开发者数量)、authors(作者)、download_counts(下载量)、sum(总和)、package_count(包数量)、largest(最大值)、cumulative_deps_count(累计依赖数)、unique_deps_count(唯一依赖数)、all_direct_deps_names(所有直接依赖名称)等字段
- 作者信息文件
- 文件名称:trivial_package_author.csv
- 文件格式:CSV
- 字段映射介绍:包含trivial_package(轻量包)及相关作者信息,如02-szhm18、02.lijcreatefolder等
- 依赖关系文件
- 文件名称:dependencies.csv
- 文件格式:CSV
- 字段映射介绍:包含依赖关系相关数据,具体字段未明确展示
适用场景
- 科研问题分析:用于验证和分析MSR相关研究问题的数据支撑
- 调查数据统计:对调查问题结果进行统计与分析
- 依赖模式研究:通过依赖模式摘要数据,分析依赖关系的模式特征及使用情况
- 作者信息分析:研究轻量包的作者分布及相关信息
- 依赖关系挖掘:探索依赖关系数据中的关联规则与模式