-
ProGen2_Generated_生物基因序列生成与适应性评估数据
2026年1月27日 30 3 1
数据集概述 本数据集包含预训练和微调ProGen2模型生成的基因序列,以及用于评估该模型的适应性基准数据。数据以压缩包形式存储,共2个文件,无目录结构,主要用于生物信息学领域的基因序列相关研究与模型评估。 文件详解 generated_sequences.zip 文件格式:ZIP 内容说明:包含ProGen2模型(预训练及微调版本)生成的基因序列数据...
-
generated_texts_Based_生物基因NLP微调模型评估数据
2026年1月21日 30 149 147
数据集概述 本数据集包含用于模型评估的微调模型生成文本,核心围绕生物基因领域的NLP文本生成任务。数据集仅含1个JSON格式文件,无训练/测试、数据/标签或原始/处理数据划分,无目录层级结构,是生物基因NLP模型评估的专用文本资源。 文件详解 文件名称:generated_texts.json 文件格式:JSON...
-
Fine_Tuning_Large_Language_Model_安全代码生成大语言模型微调复现数据
2026年1月5日 30 30 9
数据集概述 本数据集是论文“Fine Tuning Large Language Model for Secure Code Generation”的复现包,包含大语言模型微调所需的数据集及模型评估结果,用于支持安全代码生成方向的模型训练与性能验证研究,共包含3个文件。 文件详解 README.md 文件格式:MD...
-
LLM逆向工程序列图泛化能力复现数据包
2025年12月13日 30 206 123
数据集概述 本数据集是论文《On the Generalization Capabilities of LLMs for Reverse Engineering Sequence Diagrams》的复现数据包,包含实验所需的源代码、模型生成的序列图数据等,支持复现论文中的研究结果。 文件详解 RE-LLMs-...
-
蛋白质与编码序列整合语言模型数据集
2025年12月22日 30 46 1
数据集概述 本数据集围绕蛋白质与编码序列整合以增强语言模型的研究主题构建,包含训练数据、微调模型、多模态数据集及特征嵌入等多类文件,为相关领域的模型训练与分析提供数据支持。 文件详解 根目录文件: source_data.zip: ZIP压缩包,包含项目所有子目录及文件 TE_MRL目录: MRL_dataset.zip:...
-
基于LLM的编码助手澄清问题设计数据集及模型权重
2025年12月7日 30 31 19
数据集概述 本数据集包含用于研究“通过设计激发好奇心:基于LLM的编码助手询问澄清问题”的实验数据与模型权重,涵盖用户研究样本文档、分类器训练数据、测试管道数据、合成数据集及训练后的模型权重文件,为编码助手交互机制研究提供支持。 文件详解 文档文件: Sample of User Study RQ1_ name of...
-
金融微调数据集FinetuneDataDataset-ibrahimmostafai
2025年5月29日 30 130 49
金融微调数据集FinetuneDataDataset-ibrahimmostafai 数据来源:互联网公开数据 标签:金融数据,微调模型,机器学习,数据集,时间序列,市场分析,经济预测,金融工程 数据概述: 该数据集包含来自金融市场的历史数据,适用于金融模型的微调任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...



