数据集概述
本数据集是论文“On the Helpfulness of Answering Developer Questions on Discord with Similar Conversations and Posts from the Past”的复现包,包含代码、社区数据、原始数据、实证分析结果、问题集、建议内容等8个文件,支持复现研究过程、分析参与者评估结果、生成词嵌入及复用标注数据,用于探究历史对话和帖子辅助回答开发者Discord问题的有效性。
文件详解
- LICENSE:无格式说明,为数据集许可文件
- README.md:MD格式,介绍复现包用途,包括实证分析复现、标注数据复用、词嵌入生成及参与者评估分析等内容
- 06_questions.zip:ZIP格式,包含问题集相关数据
- 03_community_data.zip:ZIP格式,包含开发者社区相关数据
- 04_raw_data.zip:ZIP格式,包含原始数据
- 02_empirical_analysis.zip:ZIP格式,包含实证分析相关数据
- 05_suggestions.zip:ZIP格式,包含建议内容相关数据
- 01_code.zip:ZIP格式,包含研究使用的代码文件
数据来源
论文“On the Helpfulness of Answering Developer Questions on Discord with Similar Conversations and Posts from the Past”
适用场景
- 开发者社区问答效率研究:分析历史对话和帖子辅助回答Discord开发者问题的有效性
- 问答系统优化:基于复现包中的词嵌入生成方法,优化开发者问答系统的回答建议功能
- 实证研究复现:支持复现论文中的实证分析过程,验证研究结论
- 开发者行为分析:通过社区数据和原始数据,分析开发者在Discord平台的提问及互动行为