-
半球形照片二值化算法准确性评估数据
2026年2月15日 30 120 31
数据集概述 本数据集为半球摄影协议标准化研究的配套数据,聚焦七种二值化算法在处理半球摄影图像时的准确性评估。通过将算法自动二值化结果与人工分类的参考像素数据对比,计算百分比正确率(PC)和kappa统计量(K),并分析不同曝光设置(自动曝光、直方图曝光)对算法性能的影响,同时包含间隙分数的估算结果,共含4个文件。 文件详解 thresholds.csv...
-
开发者代码注释实践多源讨论研究复现数据包
2026年2月9日 30 65 37
数据集概述 本数据集是论文《What do Developers Discuss about Code Comments?》的复现数据包,包含支持研究问题RQ1和RQ2的所有数据文件,涵盖论文附录、标签与主题清单、Stack Exchange查询接口说明,以及LDA分析的输入输出数据、原始问答数据和人工分析分类结果等内容。 文件详解 根目录文件...
-
COVID_19社交媒体与科学出版物传播情境分析数据集
2026年1月31日 30 153 27
数据集概述 本数据集包含社交媒体X上提及2020年10月7日发表的《Dying in a Leadership Vacuum》社论的帖子情感分析结果。数据通过Altmetric平台收集,经ChatGPT 3.5和Gemini 1.5 Flash进行情感分类,并与人工分类对比,涉及账户类型(机器人/人类)及分类一致性评估,共含九千余条帖子数据。 文件详解...
-
SO_Solution_Snippets_Stack_Overflow解决方案片段呈现与复用研究数据
2026年1月5日 30 199 0
数据集概述 本数据集为Stack Overflow平台解决方案片段研究的支撑数据,包含两类人工标注文件:一类是对含解决方案片段的问题的分类数据,另一类是对解决方案片段的标注数据。数据用于分析Stack Overflow中解决方案片段的呈现方式及复用适配方法,为提升知识共享效率和优化生成式AI工具提供参考。 文件详解 Manual-...
-
移动应用中以人为中心问题的开发者支持数据集
2025年12月19日 30 69 31
数据集概述 该数据集为复现包,包含从12个同时存在于Google App Store和GitHub的项目中随机抽取的1200条应用评论、1200条问题评论的人工分析数据,以及机器学习和深度学习方法的结果、开发者调查问卷及原始回复。 文件详解 文件名称: IssueComments-Categories.xlsx,格式: .xlsx,内容:...



