数据集概述
本数据集是论文《An Empirical Investigation on the Challenges in Scientific Workflow Systems Development》的附属资料,围绕科学工作流系统(SWSs)的功能价值、开发角色及挑战展开,整合了从Stack Overflow和GitHub获取的相关讨论、问题及拉取请求数据,为研究SWSs开发领域的实际挑战提供支持。
文件详解
- 文件名称: Scripts.zip
- 文件格式: ZIP压缩包
- 内容说明: 可能包含用于数据收集、处理或分析的脚本文件
- 文件名称: Collected Stack Overflow Data.zip
- 文件格式: ZIP压缩包
- 内容说明: 收集的Stack Overflow平台上与科学工作流系统相关的讨论数据
- 文件名称: RQ2 Types Analysis.zip
- 文件格式: ZIP压缩包
- 内容说明: 与研究问题2(RQ2)类型分析相关的数据或结果文件
- 文件名称: SO Data Other Fileds.zip
- 文件格式: ZIP压缩包
- 内容说明: Stack Overflow数据中其他字段的补充数据文件
- 文件名称: GitHub Data.zip
- 文件格式: ZIP压缩包
- 内容说明: 从GitHub平台获取的与科学工作流系统相关的问题及拉取请求数据
- 文件名称: Final_Topics.zip
- 文件格式: ZIP压缩包
- 内容说明: 最终确定的科学工作流系统开发挑战相关主题数据
- 文件名称: scientific-workflow-systems-list.xlsx
- 文件格式: Excel表格(.xlsx)
- 内容说明: 科学工作流系统列表数据,可能包含系统名称、类型等信息
适用场景
- 软件工程研究: 分析科学工作流系统开发过程中面临的技术挑战与解决方案
- 开发者社区研究: 探究Stack Overflow和GitHub等平台上SWSs开发者的讨论热点与协作模式
- 科研工具优化: 为科学工作流系统的功能改进、性能优化提供实证依据
- 学术论文复现: 支持对原论文研究结论的验证与扩展分析