数据集概述
本数据集包含论文配套的代码与数据,用于从混合不完全高维数据中估算个体间马氏距离,并应用于分析公元前3至1千年西南德国的人类骨骼遗存。数据涵盖预处理的牙齿形态特征数据集、完整数据集及FLEXDIST工具的R代码,支持考古学中个体差异与群体结构的研究。
文件详解
- R代码文件
- 文件名称:R code for FLEXDIST.txt
- 文件格式:TXT
- 字段映射介绍:包含执行FLEXDIST工具的R代码,支持处理混合类型(名义、有序、连续)变量、缺失值及高维数据,计算个体间马氏距离。
- 预处理数据集
- 文件名称:data.csv
- 文件格式:CSV
- 字段映射介绍:包含64个考古人类遗存的85项牙齿形态特征,字段包括标本ID、遗址及特征变量(标注类型为O有序、N名义、C连续)。
- 完整数据集
- 文件名称:complete dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含144个考古人类遗存的199项牙齿形态特征,涵盖更全面的样本与特征信息。
数据来源
论文“Estimating inter-individual Mahalanobis distances from mixed incomplete high-dimensional data: Application to human skeletal remains from 3rd to 1st millennia BC Southwest Germany”
适用场景
- 考古个体差异分析:利用马氏距离估算结果,研究青铜铁器时代人类骨骼遗存的个体形态差异与群体结构。
- 混合高维数据处理方法验证:测试FLEXDIST工具在处理含缺失值、多类型变量的考古数据中的性能。
- 牙齿形态特征研究:通过完整数据集分析牙齿形态特征的分布规律与考古学意义。
- 考古遗址人群关系研究:结合遗址信息与距离数据,探讨不同遗址人群的遗传或文化关联。