DRIP_Based_软件需求文档段落需求提取数据集

数据集概述

本数据集为DRIP项目相关的软件需求文档数据集,包含近五年RE、ICSE、REFSQ、REJ会议及期刊的软件需求文档数据,共4个归档文件,用于从软件需求文档段落中提取单个需求的任务。

文件详解

  • 训练数据文件
  • 文件名称:trainData.gz
  • 文件格式:.gz
  • 字段映射介绍:未提供具体字段信息
  • 标注数据文件
  • 文件名称:annotation data.zip
  • 文件格式:.zip
  • 字段映射介绍:未提供具体字段信息
  • 原始数据文件
  • 文件名称:original data.zip
  • 文件格式:.zip
  • 字段映射介绍:未提供具体字段信息
  • 测试数据文件
  • 文件名称:testData.zip
  • 文件格式:.zip
  • 字段映射介绍:未提供具体字段信息

适用场景

  • 软件需求工程研究: 用于研究从软件需求文档段落中自动提取单个需求的算法模型
  • 自然语言处理任务: 支持文本分割、信息抽取等NLP任务的模型训练与测试
  • 软件工程文档分析: 辅助分析软件需求文档的结构与内容特征
  • 会议期刊数据应用: 利用近五年RE、ICSE等会议期刊的需求文档数据开展领域特定研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 472.27 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。