-
科学工作流系统开发挑战实证研究论文附属数据集
2025年12月10日 30 37 29
数据集概述 本数据集是论文《An Empirical Investigation on the Challenges in Scientific Workflow Systems Development》的附属资料,围绕科学工作流系统(SWSs)的功能价值、开发角色及挑战展开,整合了从Stack...
-
代码注释对Stack_Overflow帖子感知有用性影响数据集
2025年12月9日 30 89 43
数据集概述 本数据集围绕代码注释对Stack Overflow帖子感知有用性的影响展开,包含91名参与者的在线实验数据、问卷文档等,旨在分析不同类型代码注释对开发者(尤其是新手)感知帮助度的作用。 文件详解...
-
LLM生成的库导入复制包
2025年12月8日 30 180 54
数据集概述 本数据集是论文《How Robust are LLM-Generated Library Imports? An Empirical Study using Stack Overflow》的复制包,包含复现该研究所需的数据、代码及说明文档,聚焦分析大语言模型(LLM)生成Python代码时推荐的库导入情况。 文件详解 文件名称:...
-
Stack_Overflow问题情感分类开发者与工具复现数据包
2025年12月8日 30 82 70
数据集概述 该数据集是SEMotion 2021论文《How Developers and Tools Categorize Sentiment in Stack Overflow Questions - A Pilot Study》的复现数据包,包含10个Stack...
-
多样性作为催化剂_揭示Stack_Overflow软件工程的全球社会技术动态_复现包
2025年12月7日 30 141 24
数据集概述 本数据集是一项研究的复现包,聚焦软件工程领域中人类因素(如地理、社会经济、文化和人口多样性)对实践的影响。通过定量与定性结合的方法,涵盖文献综述、全球关联分析及美国特定情境研究,揭示多样性对开发者社区集体智慧、知识共享及技术产出的作用。 文件详解 文件名称: Replication Package.zip 文件格式: ZIP (.zip)...
-
Stack_Overflow代码片段生成问题标题论文数据集
2025年12月7日 30 186 8
数据集概述 该数据集是论文《Generating Question Titles for Stack Overflow from Mined Code Snippets》的配套数据,内容为从Stack Overflow数据转储中提取的代码片段及相关信息,用于支持代码片段生成问题标题的研究。 文件详解 文件名称: Code2Que-data.zip...
-
LegitPhish网络钓鱼与合法URL识别数据集
2025年11月29日 30 18 6
数据集概述 本数据集包含十万一千二百一十九条URL记录及十八个特征(含标签),其中网络钓鱼URL六万三千六百七十八条、合法URL三万七千五百四十条。数据来源可靠,网络钓鱼URL经人工验证,合法URL来自维基百科等可信平台,适用于URL安全检测模型训练与评估。 文件详解 文件名称: LegitPhish...



