数据集 - 海数据

工业环境下LLM单元测试生成复现包2025

2025年12月7日

数据集概述本数据集是论文《工业环境下LLM单元测试生成：挑战、演进与实践经验》的复现包，包含3个PDF文件，涵盖项目说明、最终提示词文档及功能聚合结果，为复现研究成果提供完整资料。文件详解 README.pdf：PDF格式，项目说明文档，包含复现指南、研究背景及文件结构等信息...

ZIP

意大利语工作招聘广告中的合同翻倍现象_提示词列表_大语言模型与生成回复数据集

2025年12月6日

数据集概述本数据集聚焦意大利语工作招聘广告中的“合同翻倍”现象，包含相关提示词列表、大语言模型及其生成的回复内容，以PDF文档形式呈现，为研究该现象及大语言模型应用提供数据支持。文件详解文件名称: De Cesare_Weidensdorfer_Burchardt_Sdoppiamenti generati.pdf 文件格式: PDF...

ZIP

DOM事件探索与LLMs用于Web测试不稳定定位数据集

2025年12月6日

数据集概述本数据集围绕DOM事件探索与大语言模型（LLMs）在Web测试不稳定定位中的应用展开，包含相关项目文件、实验结果及源代码，为研究Web测试不稳定问题的定位方法提供支持。文件详解项目与结果压缩包： projects & results.zip：压缩文件，包含所有实验所用项目的源文件、数据处理文件及实验结果数据与结果分析文件：...

ZIP

基于大语言模型的代码异味识别实验复现包

2025年12月6日

数据集概述本数据集是论文《AttentionSmelling：使用大语言模型识别代码异味》的复现包，聚焦GPT-4o对Java代码中三种关键代码异味（长方法、上帝类、特性羡慕）的检测能力，包含实验全流程的Jupyter笔记本、数据集参考及分析脚本，支持研究复现与扩展。文件详解该数据集包含4个文件，具体说明如下： -...

ZIP

ChatGPT生成的推荐内容数据集

2025年12月6日

数据集概述本数据集包含由ChatGPT生成的推荐内容相关数据，以单一PDF文档形式呈现，为研究AI生成推荐的内容特征、结构逻辑等提供基础资料。文件详解文件名称：EDUUC8EU_supplementary_data.pdf 文件格式：PDF（.pdf）...

ZIP

ChatGPT自然语言需求不一致检测初步评估补充材料

2025年12月6日

数据集概述本数据集为"ChatGPT自然语言需求不一致检测初步评估"的补充材料，包含数据与标注内容。主要呈现每份文档中ChatGPT回答的标注结果、人工分析的标注结果，以及需求和真实值对，其中原始需求与变体需求通过第三列标识区分。文件详解文件名称: Inconsistencies-chatGPT.pdf 文件格式: PDF (.pdf)...

ZIP

大语言模型时代IDE内人机交互体验文献综述数据集

2025年12月6日

数据集概述本数据集是围绕“大语言模型时代IDE内人机交互体验”主题的文献综述配套数据，包含综述文档及结构化文献信息，为研究该领域的文献脉络与核心内容提供支持。文件详解文件名称：in-IDE HAX literature review.pdf 文件格式：PDF 内容说明：可能为该文献综述的完整论文文档文件名称：in-IDE HAX...

ZIP

低成本GPU上的大语言模型基准测试研究数据集

2025年12月5日

数据集概述本数据集为论文《LLMs on Affordable GPUs: A Benchmarking Study》的配套数据，包含大语言模型在低成本GPU上的问答与计时原始数据、分析图表示例及所用源代码，支持相关研究的复现与扩展。文件详解文件名称: rawData.tar 文件格式: TAR (.tar) 内容说明:...

ZIP

在线用户反馈质量特征分类研究附录与补充材料

2025年12月5日

数据集概述本数据集是《在线用户反馈中质量特征的分类》研究的在线附录与补充材料，包含论文各部分的补充或完整内容PDF文档，以及整理了研究工件、数据和结果的压缩包，为研究低数据场景下质量特征分类方法提供支持。文件详解文件名称:...

ZIP

非结构化数据向关系型数据库迁移的大语言模型方法数据集

2025年12月4日

数据集概述本数据集为研究使用预训练大语言模型实现非结构化数据向关系型数据库迁移的方法提供支持，包含相关实验或案例数据的压缩文件。文件详解文件名称: tcc_leon_martins_datasets.zip 文件格式: ZIP压缩包内容说明: 包含研究非结构化数据向关系型数据库迁移方法的数据集文件，具体内容需解压后查看。适用场景...

ZIP

大语言模型微调问答数据集

2025年10月22日

大语言模型微调问答数据集_Large_Language_Model_Fine_tuning_Question_Answering_Dataset 数据来源：互联网公开数据标签：大语言模型, 微调, 问答, 自然语言处理, 文本生成, 模型训练, 迁移学习, 机器学习数据概述：...

ZIP

大语言模型输出对比评估数据集

2025年9月9日

大语言模型输出对比评估数据集_Large_Language_Model_Output_Comparison_Evaluation_Dataset 数据来源：互联网公开数据标签：大语言模型, 模型评估, 对比分析, 文本生成, 机器学习, 自然语言处理, 人工智能, 问答系统数据概述：...

ZIP

大语言模型指令微调数据集

2025年7月4日

大语言模型指令微调数据集_Large_Language_Model_Instruction_Fine_tuning_Dataset 数据来源：互联网公开数据标签：大语言模型, 指令微调, 文本生成, 自然语言处理, 问答, 数据集, 机器学习, 模型训练数据概述：...

ZIP

多语言指令微调问答数据集

2025年7月7日

多语言指令微调问答数据集_Multilingual_Instruction_Fine_tuning_Question_Answering_Dataset 数据来源：互联网公开数据标签：自然语言处理, 问答系统, 多语言, 指令微调, 机器翻译, 文本生成, 模型训练, 大语言模型数据概述：...

ZIP

零样本大语言模型时间序列预测性能评估数据集-vittoriorossi

2025年5月31日

零样本大语言模型时间序列预测性能评估数据集-vittoriorossi 数据来源：互联网公开数据标签：零样本,大语言模型,时间序列,预测,性能评估,基准测试数据概述：...

ZIP

大语言模型越狱攻击检测数据集LargeLanguageModelJailbreakAttackDetectionDataset-defdet

2025年5月30日

大语言模型越狱攻击检测数据集LargeLanguageModelJailbreakAttackDetectionDataset-defdet 数据来源：互联网公开数据标签：大语言模型, 越狱攻击, 对抗样本, 文本分类, 安全评估, 模型安全, 自然语言处理, 数据增强数据概述：...

ZIP

大语言模型对话比较数据集LargeLanguageModelDialogueComparisonDataset-sparsh35

2025年5月30日

大语言模型对话比较数据集LargeLanguageModelDialogueComparisonDataset-sparsh35 数据来源：互联网公开数据标签：大语言模型, 对话分析, 模型评估, 自然语言处理, 文本生成, 对比分析, 机器学习, 英语数据概述：...

ZIP

Gemma模型重写数据集RewrittenGemma-7bDataset-patrickjchen

2025年5月30日

Gemma模型重写数据集RewrittenGemma-7bDataset-patrickjchen 数据来源：互联网公开数据标签：自然语言处理，机器学习，深度学习，文本生成，语言模型，模型重写，人工智能，大语言模型数据概述：该数据集包含对Gemma-7b语言模型的输出进行重写的数据，记录了原始文本和经过模型重写后的文本。主要特征如下：...

ZIP

Gemma2模型微调数据集-anshdarji

2025年5月29日

Gemma2模型微调数据集-anshdarji 数据来源：互联网公开数据标签：大语言模型，微调，数据集，自然语言处理，文本生成，机器学习，人工智能，Gemma 数据概述：该数据集包含了用于微调 Gemma 2 模型的数据，旨在提升模型在特定任务上的表现。主要特征如下：时间跨度：数据生成时间随数据集内容而异，涵盖不同时间段的文本信息。...