-
miniF2F_Graded_LLM_Based_大语言模型定理证明难度分级完整数据
数据集概述 该数据集基于miniF2F扩展,为每个定理新增难度、区分度和难度分级三个指标。指标依据大语言模型(LLMs)证明定理的实际表现计算,更准确反映从LLM视角的定理难度,包含数据文件、说明文档及图表,为定理证明评估提供支持。 文件详解...
-
自然语言处理大型语言模型蜕变测试数据集2025
数据集概述 本数据集是ICSME 2025会议论文相关研究的配套数据,围绕自然语言处理(NLP)任务中大型语言模型(LLM)的蜕变测试展开,包含RQ1至RQ3及额外分析的实验结果、人工标注与汇总数据,所有文件以JSON格式存储,为LLM蜕变测试研究提供支撑。 文件详解 该数据集以ZIP压缩包形式组织,内部包含多个JSON文件和目录,具体说明如下: -...
-
数字人文语言差距研究补充数据集
数据集概述 本数据集是论文《数字人文中的语言差距:LLM辅助SKOS词表翻译》的补充数据,包含用于评估自动化SKOS词表翻译工具WOKIE的原始及翻译后的词表,覆盖考古学、文化时期等五个主题领域,以及本体匹配结果。 文件详解 该数据集由多个主题文件夹和结果文件夹组成,具体说明如下: - 主题词表文件夹(共五个): -...
-
可配置系统编译错误识别大语言模型能力评估数据集2024
数据集概述 该数据集包含对大语言模型(LLMs)识别可配置系统编译错误能力评估的查询日志文件,数据来源于Albuquerque et al. 2024(SBES-IIER 2024)的相关研究,为分析LLMs在该任务中的表现提供支持。 文件详解 文件名称: sheet.css,文件格式: CSS,用于网页样式定义 文件名称: Small -...
-
基于LLM和思维链提示的SAI报告遵循ISSAI3000标准分析数据集
数据集概述 该数据集为一项研究的复现数据,研究构建了基于大语言模型(LLM)的自动化框架,评估三十三个国家最高审计机关(SAIs)的绩效审计报告对ISSAI3000标准的遵循情况,包含标准文本、报告文件及分析结果。 文件详解 文件名称:SAI_reports_and_ISSAI3000_standards.zip 文件格式:ZIP压缩包...
-
LLM一致性测试组合测试用例数据集
数据集概述 该数据集是用于大语言模型(LLM)一致性测试的组合测试用例集合,包含问题、同义词列表、覆盖数组、测试运行记录、模型输出及性能评估结果,支持分析Starling-LM、Llama系列等6个模型的响应一致性与准确性。 文件详解 核心问题文件:...
-
退税案例解释质量调查数据集
数据集概述 本数据集包含针对退税申请场景的解释质量感知(保真度与互操作性)调查相关文件,涵盖用户调查数据、实验设计文档、大语言模型(LLM)生成内容及评估材料,为研究退税场景下解释质量的感知与评估提供多维度数据支持。 文件详解 调查数据文件: data-survey.csv:CSV格式调查数据集,含128名用户对2个查询案例的评分 data-...
-
基于大语言模型的自动驾驶软件代码生成与仿真报告数据集
数据集概述 本数据集包含基于大语言模型生成的自动驾驶软件代码、对应报告及仿真可视化视频,覆盖代码生成(迭代0)与修正(迭代1)两个阶段,为研究自动驾驶软件的安全代码生成方法提供数据支持。 文件详解 文件名称: Generated code in initiaion t13.pdf,格式: PDF 内容:...
-
LLM生成代码变异在软件测试中的有效性实证比较数据集
数据集概述 该数据集包含实证研究“评估LLM生成代码变异在软件测试中的有效性:与PIT的比较”的全部原始构件、数据处理笔记本及结果文件,用于支持研究的复现与验证。 文件详解 文件名称:LLM-Mutator-Empirical-Comparison-Artifacts-main.zip 文件格式:ZIP压缩包...
-
LLM更新API文档研究成果数据集
数据集概述 本数据集为《Can LLMs Update API Documentation?》研究的配套成果,包含实验复现所需的项目文件、研究论文及说明文档,用于验证大语言模型结合代码变更信息更新API文档的方法有效性。 文件详解 该数据集包含三个文件,具体说明如下: - APIAutoUpdate.zip:...
-
基于eBird聊天机器人案例研究的大型语言模型生态解释应用数据集
数据集概述 本数据集围绕大型语言模型(LLMs)在生态学解释中的应用展开,以eBird聊天机器人为案例研究,探讨如何通过自然语言查询将生态观测数据转化为可操作的保护与沟通见解,提供LLM开发路线图及技术实现细节。 文件详解 文件名称:eBird_testing-main.zip 文件格式:ZIP压缩包...
-
AgentFL与SOAPFL论文结果在线存储库
数据集概述 本数据集是论文《AgentFL: Scaling LLM-based Fault Localization to Project-Level Context》的在线存储库,同时包含TSE'25论文《SOAPFL: A Standard Operating Procedure for LLM-based Method-Level Fault...
-
LLM赋能的无脚本功能测试复制包
数据集概述 本数据集为“LLM赋能的无脚本功能测试”研究的复制包,包含研究中使用的TESTAR工具版本及相关实验材料,用于探索大语言模型(LLM)驱动的动作选择在无脚本GUI测试中生成满足功能需求测试序列的有效性。 文件详解 文件名称: QRS_2025_LLM_empowered_scriptless_functional_testing.zip...
-
学术机会与机构事务智能聊天机器人研究复现包
数据集概述 本数据集是论文《Hello, Freire! How Can You Help Me?》的研究复现包,包含该智能聊天机器人相关的评估问卷、用户反馈表单及研究分析文件,为复现论文结论提供数据支持。 文件详解 问卷与表单文件(PDF格式): Validação Ingressantes - Formulários...
-
使用大语言模型增强软件架构技术选择决策过程研究数据包
数据集概述 本数据集是一个研究数据包,核心围绕"使用大语言模型(LLMs)增强软件架构技术选择决策过程"这一主题,包含相关研究材料的压缩文件,为该领域的研究提供数据支持。 文件详解 文件名称: ResearchBundle.zip 文件格式: ZIP压缩包(.zip) 文件内容:...
-
AI增强型网络安全需求生成可复现研究数据包
数据集概述 本数据集是AI增强型网络安全需求生成研究的可复现数据包,包含复现研究所需的脚本、数据集、提示模板及结果。研究基于大语言模型(LLMs),以IoT汽车物流平台为案例,对13种模型在不同提示管道和温度下的性能进行基准测试,支持完整复现从原始提示到最终结果的流程。 文件详解 文件名称:...
-
基于大语言模型的非功能需求自动化优先级排序数据集
数据集概述 本数据集围绕基于大语言模型(LLM)的非功能需求(NFRs)自动化识别与优先级排序展开,包含从开源项目源代码中提取的自动识别NFRs数据、专家手动标注数据及相关分析代码与文档,为研究软件需求工程中的NFRs反向获取方法提供支持。 文件详解 分析与代码文件: nfr_analysis_pipeline.ipynb:Jupyter...
-
匿名补充材料_数字人文中的语言鸿沟_LLM辅助SKOS叙词表翻译
数据集概述 本数据集为匿名补充材料,支持研究论文《Mind the Language Gap in Digital Humanities: LLM-Aided Translation of SKOS Thesauri》,内容围绕数字人文领域的语言鸿沟问题及大语言模型辅助SKOS叙词表翻译展开。 文件详解 文件名称: data-...
-
Android应用多模态GUI测试生成的LLM评估数据集
数据集概述 本数据集是围绕Android应用多模态GUI测试生成任务的大语言模型(LLM)评估相关数据,以压缩包形式存储,未提供具体内容预览。 文件详解 文件名称: dataset+results.zip 文件格式: ZIP (.zip) 内容说明:...
-
代码审查问责制研究复制包
数据集概述 本数据集为论文《Accountability in Code Review: The Role of Intrinsic Drivers and the Impact of LLMs》的复制包,包含代码审查问责制研究的核心数据与文档,涉及软件开发中代码质量问责的内在驱动因素及大语言模型(LLM)辅助审查对问责机制的影响。 文件详解...



