基于大语言模型的非功能需求自动化优先级排序数据集

数据集概述

本数据集围绕基于大语言模型(LLM)的非功能需求(NFRs)自动化识别与优先级排序展开,包含从开源项目源代码中提取的自动识别NFRs数据、专家手动标注数据及相关分析代码与文档,为研究软件需求工程中的NFRs反向获取方法提供支持。

文件详解

  • 分析与代码文件:
  • nfr_analysis_pipeline.ipynb:Jupyter Notebook格式,可能包含NFRs分析的完整流程代码
  • nfr_extractor.ipynb:Jupyter Notebook格式,可能包含从源代码中提取NFRs的代码实现
  • 数据文件(JSON格式):
  • nfrs_automated_openmrs.json:自动识别的NFRs数据(基于OpenMRS项目)
  • nfrs_manual_openmrs.json:专家手动标注的NFRs数据(基于OpenMRS项目)
  • nfrs_subset_contextual_validation.json:用于上下文验证的NFRs子集数据
  • nfrs_contextual_validation.json:上下文验证的NFRs完整数据
  • 文档文件:
  • artifact_index.pdf:PDF格式,可能包含数据集构件的索引说明

适用场景

  • 软件需求工程研究:分析LLM在非功能需求自动化识别中的应用效果
  • 大语言模型应用研究:探索LLM在源代码分析与需求提取任务中的性能优化方向
  • 开源软件质量评估:基于源代码反向获取NFRs以评估软件质量属性
  • 需求优先级排序方法验证:对比自动与手动NFRs优先级排序的差异与改进空间
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.62 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。