数据集 - 海数据

LLM生成代码片段可读性对比数据集

2025年12月19日 30 198 53

数据集概述本数据集聚焦LLM生成代码片段的可读性研究，包含ChatGPT、DeepSeek、Gemini三款模型生成代码的对比分析相关文件，以压缩包形式提供，为探究不同大语言模型代码生成质量差异提供数据支持。文件详解文件名称：Replication Package.zip 文件格式：ZIP（压缩包格式）...

ZIP

miniF2F_Graded_LLM_Based_大语言模型定理证明难度分级完整数据

2025年12月19日 30 67 12

数据集概述该数据集基于miniF2F扩展，为每个定理新增难度、区分度和难度分级三个指标。指标依据大语言模型（LLMs）证明定理的实际表现计算，更准确反映从LLM视角的定理难度，包含数据文件、说明文档及图表，为定理证明评估提供支持。文件详解...

ZIP

LLMAID_Android应用AI能力识别数据集

2025年12月19日 30 104 62

数据集概述本数据集围绕LLMAID项目构建，核心内容为用于识别Android应用中AI能力的相关数据，以压缩包形式存储，未提供具体内容预览，为研究Android应用AI功能检测提供基础数据支持。文件详解文件名称: OpenCodeData.zip 文件格式: ZIP (.zip) 内容说明:...

ZIP

模型质量评估_人类评分_提示词_模型及LLM回答数据集

2025年12月19日 30 26 6

数据集概述该数据集为论文《Assessing Model Quality Using Large Language Models》的配套数据，包含人类评分结果、提示词、模型数据及大语言模型（LLM）回答等内容，用于模型质量评估研究。文件详解 PDF文档文件（共6个）： Results LLM_M1.pdf、Results...

ZIP

论文附录_使用GPT模型提升代码质量_将整洁代码原则自动应用于Python项目

2025年12月18日 30 114 97

数据集概述本数据集为研究论文的附录文件，包含使用GPT模型将整洁代码原则自动应用于Python项目的相关内容，如示例、表格、提示词及原始与处理后结果，以压缩包形式提供。文件详解文件名称: online appendix.zip 文件格式: ZIP 内容说明:...

ZIP

退税案例解释质量调查数据集

2025年12月15日 30 28 7

数据集概述本数据集包含针对退税申请场景的解释质量感知（保真度与互操作性）调查相关文件，涵盖用户调查数据、实验设计文档、大语言模型（LLM）生成内容及评估材料，为研究退税场景下解释质量的感知与评估提供多维度数据支持。文件详解调查数据文件： data-survey.csv：CSV格式调查数据集，含128名用户对2个查询案例的评分 data-...

ZIP

LLM更新API文档研究成果数据集

2025年12月18日 30 169 60

数据集概述本数据集为《Can LLMs Update API Documentation?》研究的配套成果，包含实验复现所需的项目文件、研究论文及说明文档，用于验证大语言模型结合代码变更信息更新API文档的方法有效性。文件详解该数据集包含三个文件，具体说明如下： - APIAutoUpdate.zip:...

ZIP

NLP_LLM_Based_葡萄牙语软件工程招聘数据对比分析完整数据

2025年12月18日 30 139 50

数据集概述本数据集围绕葡萄牙语软件工程招聘信息的数据提取任务，对比分析自然语言处理（NLP）与大语言模型（LLM）的应用效果。包含结构化数据文件与分析文档，为相关技术对比研究提供数据支持。文件详解 Vagas para Comparação.json：JSON格式数据文件，可能包含用于对比分析的葡萄牙语软件工程招聘信息原始或处理后的数据。...

ZIP

可用性相关缺陷的大语言模型数据集

2025年12月6日 30 24 8

数据集概述该数据集围绕大语言模型在可用性相关缺陷中的应用，包含真实数据、提示词、原始数据及可用性修复相关内容，为研究大语言模型处理可用性缺陷的表现提供数据支持。文件详解文件名称: Data.zip 文件格式: ZIP压缩包内容说明: 压缩包内包含四类核心数据：真实数据（Ground-truth...

ZIP

AgentFL与SOAPFL论文结果在线存储库

2025年12月5日 30 123 59

数据集概述本数据集是论文《AgentFL: Scaling LLM-based Fault Localization to Project-Level Context》的在线存储库，同时包含TSE'25论文《SOAPFL: A Standard Operating Procedure for LLM-based Method-Level Fault...

ZIP

ChatGPT对Vetala故事问题的响应数据集2023

2025年12月16日 30 184 181

数据集概述该数据集包含2023年5月前两周收集的ChatGPT（GPT-4与GPT-3.5）对Vetala故事问题的响应数据。故事选自Arthur W. Ryder改编的《Twenty-Two Goblins》及N.M. Penzer版本，用于探索AI的困境解决与心理化能力，为相关研究提供数据支持。文件详解文件名称:...

ZIP

LLM赋能的无脚本功能测试复制包

2025年12月16日 30 127 85

数据集概述本数据集为“LLM赋能的无脚本功能测试”研究的复制包，包含研究中使用的TESTAR工具版本及相关实验材料，用于探索大语言模型（LLM）驱动的动作选择在无脚本GUI测试中生成满足功能需求测试序列的有效性。文件详解文件名称: QRS_2025_LLM_empowered_scriptless_functional_testing.zip...

ZIP

使用大语言模型增强软件架构技术选择决策过程研究数据包

2025年12月16日 30 178 52

数据集概述本数据集是一个研究数据包，核心围绕"使用大语言模型（LLMs）增强软件架构技术选择决策过程"这一主题，包含相关研究材料的压缩文件，为该领域的研究提供数据支持。文件详解文件名称: ResearchBundle.zip 文件格式: ZIP压缩包（.zip）文件内容:...

ZIP

敏捷_Scrum需求工程挑战与GenAI性能对比数据集

2025年12月16日 30 157 148

数据集概述本数据集为探究敏捷/Scrum需求工程挑战及GenAI与新手开发者性能对比的研究提供支持，包含模拟Scrum项目的需求启发笔记、ChatGPT及Gemini的响应文件，以及验证组（Val）的响应文件，覆盖2023至2024年的四个项目周期。文件详解说明文件： ReadMe.txt：文本格式，可能包含数据集的基本说明、文件结构及使用指引。...

ZIP

儿童与机器语言学习对比研究补充材料

2025年12月15日 30 10 9

数据集概述本数据集为《儿童与机器语言学习：人类语言的逻辑结构能否释放大语言模型潜力？》一文的补充材料，包含对话转录、结构化数据、分析脚本及可视化结果，支撑人类语言学习逻辑结构与大语言模型训练差异的研究结论。文件详解该数据集包含7个文件，具体说明如下： - 文档类文件： -...

ZIP

AI增强型网络安全需求生成可复现研究数据包

2025年12月15日 30 187 177

数据集概述本数据集是AI增强型网络安全需求生成研究的可复现数据包，包含复现研究所需的脚本、数据集、提示模板及结果。研究基于大语言模型（LLMs），以IoT汽车物流平台为案例，对13种模型在不同提示管道和温度下的性能进行基准测试，支持完整复现从原始提示到最终结果的流程。文件详解文件名称:...

ZIP

基于大语言模型的非功能需求自动化优先级排序数据集

2025年12月15日 30 46 21

数据集概述本数据集围绕基于大语言模型（LLM）的非功能需求（NFRs）自动化识别与优先级排序展开，包含从开源项目源代码中提取的自动识别NFRs数据、专家手动标注数据及相关分析代码与文档，为研究软件需求工程中的NFRs反向获取方法提供支持。文件详解分析与代码文件： nfr_analysis_pipeline.ipynb：Jupyter...

ZIP

PMo流程模型与文本描述数据集

2025年12月14日 30 32 1

数据集概述该数据集包含五十五个流程模型及其对应的文本描述，旨在支持流程建模领域的研究。每个模型提供九种不同表示形式，部分格式专为大语言模型（LLM）兼容性设计。数据集以压缩包形式存储，便于获取与使用。文件详解数据集包含一个压缩包文件，具体说明如下： - 文件名称: pmo-dataset.zip - 文件格式: ZIP (.zip) -...

ZIP

AI智能体信任度实验研究补充材料

2025年12月14日 30 184 43

数据集概述本数据集是题为《Can We Trust AI Agents?》的研究工作补充材料，围绕基于大语言模型的多智能体系统伦理信任度展开实验研究，包含实验相关的提示词、结果文本及图表等补充内容。文件详解文本文件（共33个，格式为.txt）：...

ZIP

代码文档生成提示工程控制实验复现包

2025年12月14日 30 194 180

数据集概述该数据集为论文《Can Developers Prompt? A Controlled Experiment for Code Documentation Generation》的复现包，包含控制实验数据、VS Code扩展工具及会议演示幻灯片，支持研究结果的验证与复现，聚焦开发者使用大语言模型生成代码文档的提示工程能力差异。文件详解...

ZIP

找到77个数据集

注册成功！