数据集概述
本数据集是论文“How Do I Refactor This? An Empirical Study on Refactoring Trends and Topics in Stack Overflow”的配套数据,包含Stack Overflow平台上重构相关讨论的结构化数据、分析结果及模型文件,用于研究开发者在重构实践中的需求与趋势,覆盖代码优化、工具使用等五大主题。
文件详解
- README.txt
- 文件格式:TXT
- 字段映射介绍:数据集说明文档,提供文件内容概述
- Stackoverflow-Refactor.sqlite
- 文件格式:SQLite
- 字段映射介绍:包含Stack Overflow重构相关帖子数据及每个问题的LDA主题分配信息的数据库文件
- analysis.xlsx
- 文件格式:XLSX
- 字段映射介绍:提供论文中所有表格的完整行数据,包含重构讨论的统计分析结果
- LDA_Model.zip
- 文件格式:ZIP
- 字段映射介绍:LDA主题模型压缩文件,用于重构讨论的主题分类
数据来源
论文“How Do I Refactor This? An Empirical Study on Refactoring Trends and Topics in Stack Overflow”(DOI: https://doi.org/10.1007/s10664-021-10045-x)
适用场景
- 软件开发实践研究: 分析开发者在Stack Overflow上的重构需求分布,了解实际开发中的重构痛点
- 重构工具优化: 基于讨论主题(如工具与IDE、架构设计模式)为重构工具提供功能改进方向
- 软件工程教育: 用于教学中展示真实开发场景下的重构问题与解决方案
- 自然语言处理应用: 利用LDA模型文件研究技术社区讨论的主题建模方法
- 实证软件工程研究: 作为Stack Overflow讨论数据分析的案例,支持软件工程领域的实证研究