MSR_Data_showcase_papers_Based_会议论文数据_数据集v2_2

数据集概述

本数据集包含MSR(Mining Software Repositories)会议上发表的数据展示论文相关信息,涵盖论文文献详情、引用关系、聚类结果、强引用分类及调查数据等内容,为研究软件仓库挖掘领域数据论文的特征与影响提供支持。

文件详解

  • citing_dp_dois_citations.txt:格式为TXT,记录(强/弱)引用论文对MSR数据论文的强引用和弱引用
  • data_paper_clustering.csv:格式为CSV,记录MSR数据论文的聚类过程
  • data_paper_clusters.csv:格式为CSV,记录MSR数据论文的聚类结果
  • data_papers.bib:格式为BIB,包含MSR数据论文的文献详情,以及分配的聚类(cluster字段)和强引用(usedby字段)
  • dp_dois_citations.txt:格式为TXT,记录MSR数据论文的强引用和弱引用
  • msr-all:无指定格式,包含所有MSR论文(数据与非数据类)的文献详情
  • ndp_dois_citations.txt:格式为TXT,记录MSR非数据论文的强引用和弱引用
  • ndp_rand_dois_citations.txt:格式为TXT,记录随机选择的MSR非数据论文加权样本的强引用和弱引用
  • self-citations.txt:格式为TXT,记录MSR数据论文作者对该论文的强引用
  • strong_citation_classification.csv:格式为CSV,记录强引用论文按SWEBOK知识领域的分类过程
  • strong_citation_fields.csv:格式为CSV,记录强引用论文所属的SWEBOK知识领域
  • strong_citations.bib:格式为BIB,包含强引用论文的文献详情
  • survey_questionnaire.pdf:格式为PDF,记录最终的调查问卷
  • survey_responses.csv:格式为CSV,包含匿名化的调查问卷回复(已排除邮箱地址)
  • weak_citations_notes.bib:格式为BIB,记录MSR数据论文的弱引用及引用用途

适用场景

  • 学术论文引用分析:研究MSR数据论文的引用关系(强引用、弱引用、自引用)及影响范围
  • 论文聚类研究:分析MSR数据论文的聚类特征与分类规律
  • 软件工程知识领域关联研究:基于SWEBOK知识领域分类,探索强引用论文的学科分布
  • 学术调查数据分析:利用匿名调查问卷回复,研究相关学术群体的态度与行为
  • 会议论文特征对比:对比MSR会议中数据论文与非数据论文的文献特征及引用差异
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.5 MiB
最后更新 2026年1月13日
创建于 2026年1月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。