工业环境下LLM测试生成持续评估框架复现包2025

数据集概述

本数据集是研究论文《Tracking the Moving Target: A Framework for Continuous Evaluation of LLM Test Generation in Industry》的复现包,包含2024年11月至2025年1月期间工业场景下LLM测试生成评估的相关数据、代码和提示词,支持复现和扩展研究结果。

文件详解

  • Metrics-Results-by-Function.7z(7z压缩包):包含7个Java方法的原始及处理后评估数据,需解压后查看每个方法对应的.zip文件,内含LLM生成的测试用例、覆盖率报告等
  • Metric Results by function Nov. 2024 - Jan.2025.pdf(PDF文档):展示各函数和LLM的关键原始指标表格,如代码覆盖率、测试用例数量等
  • Aggregated Results by function Nov. 2024 - Jan.2025.pdf(PDF文档):所有方法和LLM的评估结果汇总表,含整体性能趋势
  • Prompt_for_Integration_Testing-2025.pdf(PDF文档):LLM生成集成测试用例的最终提示词,含指令、上下文和输出格式
  • sources.tar.gz(tar压缩包):包含7个测试目标Java方法的原始源代码及相关依赖说明
  • README.md(Markdown文档):复现包的版本、DOI及文件说明

适用场景

  • 软件测试研究:复现工业场景下LLM测试生成的评估框架,分析不同LLM的测试生成性能
  • 提示词工程研究:基于提供的集成测试提示词,优化LLM生成测试用例的指令设计
  • 测试评估方法论:利用评估指标和结果,构建或改进LLM测试生成的评估体系
  • 代码测试实践:基于Java源代码和提示词,尝试生成测试用例并验证有效性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 23.17 MiB
最后更新 2025年12月9日
创建于 2025年12月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。