Stack_Overflow_Based_重构趋势与主题实证研究数据集

数据集概述

本数据集是论文“How Do I Refactor This? An Empirical Study on Refactoring Trends and Topics in Stack Overflow”的配套数据,包含Stack Overflow平台上重构相关讨论的结构化数据、分析结果及模型文件,用于研究开发者在重构实践中的需求与趋势,覆盖代码优化、工具使用等五大主题。

文件详解

  • README.txt
  • 文件格式:TXT
  • 字段映射介绍:数据集说明文档,提供文件内容概述
  • Stackoverflow-Refactor.sqlite
  • 文件格式:SQLite
  • 字段映射介绍:包含Stack Overflow重构相关帖子数据及每个问题的LDA主题分配信息的数据库文件
  • analysis.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:提供论文中所有表格的完整行数据,包含重构讨论的统计分析结果
  • LDA_Model.zip
  • 文件格式:ZIP
  • 字段映射介绍:LDA主题模型压缩文件,用于重构讨论的主题分类

数据来源

论文“How Do I Refactor This? An Empirical Study on Refactoring Trends and Topics in Stack Overflow”(DOI: https://doi.org/10.1007/s10664-021-10045-x

适用场景

  • 软件开发实践研究: 分析开发者在Stack Overflow上的重构需求分布,了解实际开发中的重构痛点
  • 重构工具优化: 基于讨论主题(如工具与IDE、架构设计模式)为重构工具提供功能改进方向
  • 软件工程教育: 用于教学中展示真实开发场景下的重构问题与解决方案
  • 自然语言处理应用: 利用LDA模型文件研究技术社区讨论的主题建模方法
  • 实证软件工程研究: 作为Stack Overflow讨论数据分析的案例,支持软件工程领域的实证研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 101.74 MiB
最后更新 2026年1月26日
创建于 2026年1月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。