ARTA_Based_软件需求气味与可测试性分析数据集_v1_0_0

数据集概述

本数据集是论文“Requirement testability measurement based on requirement smells”的配套数据,包含4752条来自24个项目文档的英文软件需求,每条需求标注了气味类型和可测试性程度。数据集用于支持软件需求质量工具的开发与评估,是首个公开的需求气味检测工具专用数据集,包含原始标注数据、词典及算法评估结果。

文件详解

  • Datasets目录文件
  • DS1.xlsx(格式:XLSX):含6个项目的985条需求,每条标注9种手动标记的气味类型
  • DS2.xlsx(格式:XLSX):含8个项目的1092条需求,每条标注9种手动标记的气味类型
  • DS3.xlsx(格式:XLSX):含6个项目的1522条需求,每条标注9种手动标记的气味类型
  • DS4.xlsx(格式:XLSX):含4个项目的1153条需求,每条标注9种手动标记的气味类型
  • SmellyWordsDictionary.xlsx(格式:XLSX):含计算机科学领域1000个高频词,按相似度排序,每条词标注4种专家手动标记的气味类型
  • DS1_Evaluation目录文件
  • 001_dataset1kv1.xlsx(格式:XLSX):DS1的副本,含985条需求及9种手动标注气味
  • 002_dataset1kv1_smell_frequency_with_testability.xlsx(格式:XLSX):基于001计算的需求词数、气味词数(分类型)、清洁度和可测试性程度
  • 003_dataset1kv1_ARTA_result.xlsx(格式:XLSX):ARTA工具自动检测的气味结果
  • 004_dataset1kv1_ARTA_result_smell_frequency_with_testability.xlsx(格式:XLSX):基于ARTA检测结果计算的词数、气味词数、清洁度和可测试性
  • 005_dataset1kv1_Smella_result.xlsx(格式:XLSX):Smella工具自动检测的气味结果
  • 006_dataset1kv1_Smella_result_smell_frequency_with_testability.xlsx(格式:XLSX):基于Smella检测结果计算的词数、气味词数、清洁度和可测试性

数据来源

论文“Requirement testability measurement based on requirement smells”

适用场景

  • 软件需求质量工具开发:用于训练和评估需求气味检测算法与可测试性分析模型
  • 需求工程研究:分析需求气味类型分布及对可测试性的影响机制
  • 软件工程教育:作为教学案例,展示需求质量评估的方法与实践
  • 项目管理优化:帮助需求工程师识别需求缺陷,提升软件项目需求质量
  • 算法对比实验:支持不同需求气味检测工具(如ARTA与Smella)的性能对比分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.25 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。