-
多智能体系统遗留网络应用自主升级评估数据
2026年2月9日 30 87 61
数据集概述 本数据集记录了基于大语言模型(LLM)的多智能体系统在遗留Web应用自主升级任务中的评估结果。通过零样本学习(ZSL)和单样本学习(OSL)提示,对比多智能体系统与独立LLM在代码更新中的错误类型、频率及复杂任务需求满足情况,验证多智能体系统在跨任务上下文保持和升级效率上的优势。 文件详解 文件名称:results multi-agent...
-
CVE_LLM_Based_CVE漏洞分类实验数据
2026年1月31日 30 37 6
数据集概述 本数据集包含利用大语言模型(LLM)对CVE漏洞进行分类的相关文件,涵盖CVE漏洞描述列表、分类结果及处理脚本。核心内容为不同LLM模型对CVE漏洞的分类结果对比,以及对应正确分类标注,可用于评估LLM在CVE漏洞分类任务中的性能。 文件详解 数据文件 文件名称:cve_description_list.json 文件格式:JSON...
-
Cold_Email_Generation_Datasets_提示词评估数据集
2026年1月19日 30 86 62
数据集概述 本数据集包含两个.xlsx格式的文件,用于评估大型语言模型(LLMs)在个性化冷邮件生成任务中的表现。数据集基于招聘信息,分别使用详细提示词和基础提示词生成冷邮件,记录了招聘信息、生成邮件内容、个人化字段及提示词参考等信息。 文件详解 数据集1:all_model_evaluation_P1.xlsx 文件格式:.xlsx...
-
基于UNSPSC编码的AI库存分类研究数据集
2025年12月22日 30 88 34
数据集概述 本数据集为一项关于利用大语言模型(LLMs)实现库存数据自动化分类的研究资料,以联合国标准产品和服务编码(UNSPSC)为分类框架,评估LLMs在不同场景下的分类准确性与效率,结果显示带上下文提示时LLMs在UNSPSC细分领域准确率可达百分之九十。 文件详解 文件名称: 14125ijnlc02 (2).pdf 文件格式: PDF...
-
评估ChatGPT检测Java代码安全漏洞收集数据集
2025年12月9日 30 58 44
数据集概述 本数据集包含与文章《Using "LLM for finding security vulnerabilities"》相关的实验链接,核心围绕ChatGPT在Java代码安全漏洞检测中的评估展开,以单一PDF文件形式存储相关资源链接。 文件详解 文件名称:Links.pdf 文件格式:PDF(.pdf)...
-
基于提示工程的测试用例异味检测工业实证研究数据集
2025年12月5日 30 49 39
数据集概述 本数据集是关于工业场景下利用提示工程检测测试用例异味的实证研究资料,包含测试用例异味类型分类、检测数量统计及LLM响应评估等内容,为相关技术应用效果分析提供数据支持。 文件详解 文件名称:Empirical Study - Test Case Smells using Prompt Engineering.pdf 文件格式:PDF...



