跨项目需求可追溯性自然语言工件数据集

数据集概述

本数据集聚焦跨项目需求可追溯性,基于自然语言工件构建,整合5个领域52个项目的约1100+条需求,涵盖开源仓库、工业数据集、基准数据集及非功能需求数据集,支持软件工程与自然语言处理领域的跨项目可追溯性研究与知识复用。

文件详解

  • 文件名称: Cornelius_et_al_traceability_requirements_research_dataset.xlsx
  • 文件格式: Excel (.xlsx)
  • 文件内容: 包含多个数据表,具体如下:
  • 主数据集表:整合52个项目的需求数据,覆盖开源、工业、基准及非功能需求等来源
  • 汇总统计表:需求数据的统计概览
  • 分布表:需求类型、来源等维度的分布情况
  • 字段示例:包含优先级、状态、复杂度、预估工时、利益相关者等元数据字段

适用场景

  • 软件工程研究:分析跨项目需求可追溯性链路,支持软件项目间知识转移与复用
  • 自然语言处理应用:基于自然语言工件的需求文本处理、语义关联挖掘
  • 需求工程实践:探索不同类型需求(功能/非功能)的跨项目关联模式
  • 对比学习技术验证:作为基准数据集评估跨项目需求可追溯性的算法模型性能
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.12 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。