数据集概述
本数据集是论文《Machine Learning Tools for Baraminology》的补充数据文件,包含多种生物类别的CSV数据文件及说明文档,涉及DNA相关生物数据,为分类学研究提供数据支持。
文件详解
该数据集包含14个文件,具体说明如下:
- 数据文件(共13个CSV格式文件):
- Supplementaryfile6_Hnaledi.csv:包含多列(A到BE)的生物特征数据,字段示例有数值、NA值等
- SupplementaryFile4_Flavaria.csv:未提供预览的CSV数据文件
- SupplementaryFile8_mammals.csv:未提供预览的CSV数据文件
- SupplementaryFile7_cephalopods.csv:未提供预览的CSV数据文件
- SupplementaryFile5_.csv:未提供预览的CSV数据文件
- SupplementaryFile3_dinosaurs.csv:包含c1到c52列的生物特征数据
- SupplementaryFile2_didelphines.csv:未提供预览的CSV数据文件
- SupplementaryFile9_primate.csv:未提供预览的CSV数据文件
- 其余5个未列出的CSV文件:均为未提供预览的生物相关数据文件
- 文档文件(共1个PDF格式文件):
- SupplementaryFile_Descriptions.pdf:补充文件说明文档
适用场景
- 分类学研究:用于基于机器学习的生物分类(Baraminology)分析
- 生物信息学分析:可用于DNA相关生物特征数据的统计分析
- 机器学习应用:为生物数据分类模型的训练提供基础数据
- 学术研究辅助:支持《Machine Learning Tools for Baraminology》论文相关研究的复现与扩展