源代码注释中960万链接研究数据集

数据集概述

本数据集为ICSE'19论文的研究工件,包含九百六十五万四千七百零二条源代码注释中的链接数据,关联语言及注释位置信息(含GitHub账户、仓库、提交哈希等),支持论文定量结果复现与软件工程研究复用。

文件详解

  • LICENSE.md: Markdown格式,可能包含数据集使用许可条款
  • README.md: Markdown格式,数据集及研究工件的说明文档
  • full_dataset.zip: ZIP格式,包含所有源代码注释链接的完整数据集
  • STATUS.md: Markdown格式,可能说明数据集状态或更新信息
  • INSTALL.md: Markdown格式,可能包含数据集使用或安装指引
  • paper.pdf: PDF格式,关联的ICSE'19论文全文

适用场景

  • 软件工程研究: 分析源代码注释中链接的用途、演化规律及失效模式
  • 实证研究复现: 复现ICSE'19论文中关于链接分布与特性的定量结果
  • 代码注释质量分析: 研究链接在代码注释中的作用及对代码可读性的影响
  • 软件维护研究: 探索链接失效对软件项目维护成本的影响机制
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 306.79 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。