数据集

Factoring_lexical_phonetic_phylogenetic_研究辅助材料数据

数据集概述

本数据集为论文“Factoring lexical and phonetic phylogenetic characters from word lists”的辅助材料，包含分析所需的脚本与数据文件，支持复现研究内容。文件涵盖结果文本、代码脚本、配置文件等，共十六个文件，可通过README.md了解使用细节。

文件详解

文档类文件
文件名称：README.md、results-trees.txt、sounds41.txt、listss16_recent.txt、gapPenalties.txt、pmi-world.txt
文件格式：.txt、.md
字段映射介绍：包含研究说明、系统发育树结果、语音数据、词汇列表、参数配置、PMI数据等文本内容
代码类文件
文件名称：SCACognateDetection.py、ggqd.py、alignment.py、extractFromQlc.py、qlcTCoffee.py、evaluate.r、workflow.bash
文件格式：.py、.r、.bash
字段映射介绍：包含同源词检测、对齐、结果提取、评估等分析脚本及工作流执行脚本
表格与压缩文件
文件名称：results.tsv、results-html-nexus-qlc-trees.zip
文件格式：.tsv、.zip
字段映射介绍：results.tsv含多方法分析结果表格；zip包含HTML、NEXUS格式的系统发育树结果

数据来源

论文“Factoring lexical and phonetic phylogenetic characters from word lists”

适用场景

语言系统发育研究: 用于分析词汇与语音特征的系统发育关系，复现论文中的特征提取与树构建结果
同源词检测方法评估: 基于SCACognateDetection.py等脚本，测试不同同源词检测算法的性能
语音词汇数据处理: 利用alignment.py等工具，研究词汇语音数据的对齐与特征提取技术
计算语言学工作流复现: 通过workflow.bash脚本，复现从数据处理到结果生成的完整分析流程

数据与资源

31987.zipZIP
5.93 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	5.93 MiB
最后更新	2026年1月9日
创建于	2026年1月9日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。