LLaMat_Based_语言模型预训练研究论文DOI列表数据

数据集概述

本数据集包含用于预训练语言模型LLaMat(2412.09560)的研究论文DOI列表及对应的期刊信息,为了解该模型的训练数据来源提供结构化参考,仅包含一个压缩文件。

文件详解

  • 文件名称:research_paper_dois.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩文件内包含用于LLaMat预训练的研究论文DOI列表及对应期刊信息,具体字段需解压后查看原始文件内容。

适用场景

  • 语言模型训练数据溯源: 用于分析LLaMat语言模型预训练阶段所使用的学术文献来源分布。
  • 自然语言处理研究: 参考该DOI列表复现或扩展语言模型的预训练数据构建过程。
  • 学术资源整合: 基于DOI列表获取相关研究论文,支撑自然语言处理领域的学术研究。
  • 预训练数据质量评估: 通过分析期刊分布和论文主题,评估LLaMat预训练数据的覆盖范围与专业性。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 190.9 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。