-
LLaMat_Based_语言模型预训练研究论文DOI列表数据
2026年1月29日 30 135 63
数据集概述 本数据集包含用于预训练语言模型LLaMat(2412.09560)的研究论文DOI列表及对应的期刊信息,为了解该模型的训练数据来源提供结构化参考,仅包含一个压缩文件。 文件详解 文件名称:research_paper_dois.zip 文件格式:ZIP...
-
herbarium_data_研究数据集_全球变化时代标本馆数据应用趋势分析
2026年1月20日 30 7 6
数据集概述 本数据集为“全球变化时代标本馆数据使用变化”研究的补充数据,包含1923至2017年间13,702篇相关文献的计量分析数据。通过自动化文本分析,展示标本馆数据从传统分类学研究向生物多样性信息学、全球变化生物学等新兴领域的应用扩展,体现标本在时空数据、基因型表型数据方面的价值。 文件详解 README_for_Dataset S1.rtf...
-
TUR_Based_Turku_University真菌标本采集者与鉴定者关联数据
2026年1月18日 30 112 81
数据集概述 本数据集为Turku University的TUR真菌标本馆馆藏标本关联的采集者与鉴定者数据,由志愿者通过Bionomia平台基于Global Biodiversity Information Facility聚合的标本数据生成,包含标本关联的归属声明、文献引用、标本记录等信息,以Frictionless...
-
Bionomia_GBIF_Based_哥伦比亚Anaptomecus属新种采集者与鉴定者关联数据
2026年1月7日 30 130 51
数据集概述 本数据集关联了论文《哥伦比亚Anaptomecus属(蜘蛛目:巨蟹蛛科)新种及属内已知种鉴定检索表》中的自然历史标本数据与采集者、鉴定者信息。数据由Bionomia志愿者标注,基于全球生物多样性信息网络(GBIF)聚合的标本数据集,包含9个文件,用于支持蜘蛛分类学研究中的标本溯源与人员关联分析。 文件详解 压缩文件(共8个)...



