数据集概述
本数据集是论文“Requirement testability measurement based on requirement smells”的配套数据,包含4752条来自24个项目文档的英文软件需求,每条需求标注了气味类型和可测试性程度。数据集用于支持软件需求质量工具的开发与评估,是首个公开的需求气味检测工具专用数据集,包含原始标注数据、词典及算法评估结果。
文件详解
- Datasets目录文件
- DS1.xlsx(格式:XLSX):含6个项目的985条需求,每条标注9种手动标记的气味类型
- DS2.xlsx(格式:XLSX):含8个项目的1092条需求,每条标注9种手动标记的气味类型
- DS3.xlsx(格式:XLSX):含6个项目的1522条需求,每条标注9种手动标记的气味类型
- DS4.xlsx(格式:XLSX):含4个项目的1153条需求,每条标注9种手动标记的气味类型
- SmellyWordsDictionary.xlsx(格式:XLSX):含计算机科学领域1000个高频词,按相似度排序,每条词标注4种专家手动标记的气味类型
- DS1_Evaluation目录文件
- 001_dataset1kv1.xlsx(格式:XLSX):DS1的副本,含985条需求及9种手动标注气味
- 002_dataset1kv1_smell_frequency_with_testability.xlsx(格式:XLSX):基于001计算的需求词数、气味词数(分类型)、清洁度和可测试性程度
- 003_dataset1kv1_ARTA_result.xlsx(格式:XLSX):ARTA工具自动检测的气味结果
- 004_dataset1kv1_ARTA_result_smell_frequency_with_testability.xlsx(格式:XLSX):基于ARTA检测结果计算的词数、气味词数、清洁度和可测试性
- 005_dataset1kv1_Smella_result.xlsx(格式:XLSX):Smella工具自动检测的气味结果
- 006_dataset1kv1_Smella_result_smell_frequency_with_testability.xlsx(格式:XLSX):基于Smella检测结果计算的词数、气味词数、清洁度和可测试性
数据来源
论文“Requirement testability measurement based on requirement smells”
适用场景
- 软件需求质量工具开发:用于训练和评估需求气味检测算法与可测试性分析模型
- 需求工程研究:分析需求气味类型分布及对可测试性的影响机制
- 软件工程教育:作为教学案例,展示需求质量评估的方法与实践
- 项目管理优化:帮助需求工程师识别需求缺陷,提升软件项目需求质量
- 算法对比实验:支持不同需求气味检测工具(如ARTA与Smella)的性能对比分析