Mixtecan语系贝叶斯系统发育分析补充材料数据集

数据集概述

本数据集是关于Mixtecan语系方言连续体分组贝叶斯系统发育分析的补充材料,包含样本语言元数据、自定义词表、同源词编码说明、系统发育分析文件及可视化结果等18个文件,为该语系的语言演化研究提供支持。

文件详解

该数据集包含18个文件,具体说明如下: - 元数据文件: - sm0_metadata.tsv: TSV格式,包含样本语言的元数据,字段包括LanguageID(语言ID)、VillageName(村庄名)、MapAbbr(地图缩写)、Family(语系)、Latitude(纬度)、Longitude(经度)、Glottocode(语言代码)、ISOcode(ISO代码)、JosserandCode(Josserand编码)等。 - 词表文件: - sm1_wordlist_mixtecan.tsv: TSV格式,包含Mixtecan语系的自定义词表,字段包括IDlist(词表ID)、Spanish(西班牙语对应词)、English(英语对应词)等。 - 编码说明文件: - sm2_coding_details.pdf: PDF格式,包含同源词编码和IPA转换的详细说明。 - 同源词集文件: - sm3_mixtecan_cognates.tsv: TSV格式,包含带注释的同源词集数据。 - Nexus文件: - sm4_broad_sets.nex: Nexus格式,包含粗粒度同源词编码的Nexus文件。 - sm4_fine_sets.nex: Nexus格式,包含细粒度同源词编码的Nexus文件。 - 可视化文件: - sm5_mxt-broad-NN_ngl.svg: SVG格式,基于本研究分组的NeighborNet可视化结果。 - sm5_mxt-broad-NN_joss.svg: SVG格式,基于Josserand(1983)分组的NeighborNet可视化结果。 - sm8_mxt-broad-rc_mcc_full.svg: SVG格式,最佳模型的完整MCC树可视化。 - sm8_mxt-broad-rc_densitree.png: PNG格式,DensiTree可视化结果。 - BEAST2相关文件: - sm6_mxt-broad-rc.xml、sm6_mxt-broad-sc.xml、sm6_mxt-fine-rc.xml、sm6_mxt-fine-sc.xml: XML格式,BEAST2分析的输入文件。 - sm7_mxt-broad-rc_mcc.tree、sm7_mxt-broad-sc_mcc.tree、sm7_mxt-fine-rc_mcc.tree、sm7_mxt-fine-sc_mcc.tree: TREE格式,BEAST2分析得到的MCC树文件。

适用场景

  • 历史语言学研究: 分析Mixtecan语系的方言分组及演化关系。
  • 系统发育语言学分析: 基于贝叶斯方法探究语言家族的系统发育树构建。
  • 语言数据编码研究: 研究同源词编码和IPA转换的方法与实践。
  • 语言可视化分析: 利用NeighborNet、DensiTree等工具进行语言演化可视化研究。
  • 语系元数据分析: 挖掘Mixtecan语系语言的地理分布、分类等元数据信息。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 10.61 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。