-
Chadic_Based_语方向词比较形态句法项目数据
2026年1月31日 0 160 113
数据集概述 本数据集是Chadic语方向词比较形态句法项目的修订重投版本,包含22个Jupyter Notebook代码文件、11个CSV数据文件和1个XLSX文件,共34个文件。内容覆盖语言方向词的形态句法分析、计算脚本及可视化相关数据,支持Chadic语方向词的比较研究与分析。 文件详解 代码文件(.ipynb)...
-
CLICS_2_0_Based_坦桑尼亚语言调查数据集
2026年1月30日 0 194 136
数据集概述 本数据集为CLICS 2.0的一部分,来源于20世纪70年代初开展的坦桑尼亚语言调查(TLS),涵盖约100种坦桑尼亚语言的词汇统计数据,基于斯瓦希里语和英语平行列的1079个条目翻译表整理而成,支持语言关系与词汇共性研究。 文件详解 文件名称:tls.zip 文件格式:ZIP...
-
CLDF_Based_南美低地语言比较词表数据集2024
2026年1月30日 30 167 105
数据集概述 本数据集为CLDF格式,源自Blum等人2024年的研究,包含用于探究南美低地语言间远亲关系的比较词表。数据以压缩包形式存储,可支持语言亲缘关系分析、词汇比较研究等应用。 文件详解 压缩包文件 文件名称:pano-tacanan-history/blumpanotacana-v1.2.zip 文件格式:ZIP...
-
Kam_Niger_Congo_Based语言比较词表数据
2026年1月30日 30 201 160
数据集概述 本数据集是基于莱比锡-雅加达词表收集的比较词表,用于对比Kam语与其他尼日尔-刚果语族语言的基础词汇。包含文献中已有的多种原始语言(如Jukunoid、Mumuyic、原始班图语等)的重构数据,以及作者对尼日尔-刚果语族、贝努埃-刚果语支等的准重构内容和同源词判断,仅包含一个文件。 文件详解 文件名称:Lesage2024-Kam-...
-
xflr6_Source_人称合并词类型学评估补充材料数据
2026年1月30日 30 9 0
数据集概述 本数据集是论文《Assessing the typology of person portmanteaus》的补充材料,包含1个压缩文件,用于支撑人称合并词类型学的研究评估,为语言学领域相关分析提供辅助数据支持。 文件详解 文件名称:xflr6/portmanteaus-v1.0.zip 文件格式:ZIP...
-
Saami_Based_萨米语敏感动词派生表附录数据2022
2026年1月29日 30 49 29
数据集概述 本数据集是论文附录,包含4个文件,展示不同萨米语词典来源中记录的敏感动词派生词。数据以表格/列表形式呈现,给出动词派生的基础词(按对应语言/来源或北萨米语标注)及芬兰语简短释义。数据支持萨米语形态学研究,具体来源信息参见关联论文。 文件详解 文档文件(Document files) 文件名称:Liite4-4tav-...
-
Concepticon_CLDF_Concepticon_3_4_0概念列表链接资源数据集
2026年1月17日 30 163 5
数据集概述 本数据集是Concepticon 3.4.0版本的CLDF格式资源,由List等学者编辑,旨在为概念列表的链接提供支持。它由马克斯·普朗克进化人类学研究所发布,可在线获取,包含一个压缩文件,无训练测试或数据标签等拆分结构。 文件详解 文件名称:concepticon/concepticon-cldf-v3.4.0.zip 文件格式:ZIP...
-
OLIVEIRA_Contribuições_Proto_Panoan重建贡献数据集2014
2026年1月17日 30 186 125
数据集概述 本数据集源自Oliveira 2014年题为《Contribuições para a Reconstrução do Protopáno》的研究,是基于CLDF格式的Proto-Panoan语言重建相关数据,支持历史语言学领域对Proto-Panoan语言的研究与分析,共包含1个压缩文件。 文件详解 压缩文件 文件名称:pano-...
-
ATReconstructions_Source_南岛_台语原始语言重建比较数据集_v1_1
2026年1月12日 30 190 105
数据集概述 本数据集包含原始南岛-台语、原始南岛语、原始侗台语的重建内容,以及来自原始台语、原始黎语、原始临高语、原始仡佬语、原始侗水语和拉珈语的支持数据,为南岛-台语系语言比较研究提供结构化参考。 文件详解 文件名称:Smith.ATReconstructions.v1.1.xlsx 文件格式:XLSX 字段映射介绍:包含原始南岛-...
-
Kleinewillinghöfer_Based_Bikwin_Jen语言比较词表CLDF数据集2015
2025年12月31日 30 131 116
数据集概述 本数据集是基于Kleinewillinghöfer于2015年发布的《Bikwin-Jen Comparative Wordlist》构建的CLDF格式数据集,包含Bikwin-Jen语言组的词汇比较信息,为语言比较研究提供结构化数据支持。 文件详解 主文件...
-
僧伽罗语梵语数字词汇表2_0_A至M
2025年12月23日 30 22 2
数据集概述 本数据集为僧伽罗语梵语数字词汇表2.0版本,包含字母A至M对应的词汇内容,以PDF和ODS两种格式存储,为僧伽罗语梵语词汇研究提供结构化与文档化的数据支持。 文件详解 文件名称: Sinhala Prakrit, A-M - a, ā, ä, ǟ.pdf 文件格式: PDF 内容说明:...
-
藏缅语音和词汇CLDF数据集1991
2025年12月23日 30 178 55
数据集概述 该数据集是基于孙宏开1991年出版的《藏缅语音和词汇》构建的CLDF格式数据集,核心内容为藏缅语族语言的语音与词汇相关数据,为语言比较研究提供标准化数据支持。 文件详解 文件名称:lexibank/suntb-v4.1.zip 文件格式:ZIP压缩包(.zip)...
-
现代标准斯拉夫语支平行文本数据集
2025年12月22日 30 74 12
数据集概述 本数据集包含克罗地亚语、斯洛伐克语、斯洛文尼亚语三种现代标准斯拉夫语支的平行文本,以《约翰福音》为内容,通过平行文本设计抵消体裁影响,为语言比较研究提供基础数据。 文件详解 文件名称:Gospel.Croatian.txt;格式:TXT;内容:克罗地亚语版《约翰福音》文本,基于伊万·沙里奇的新约译本...
-
基于Lieberherr和Bodt_科博瓦语比较词表_的CLDF数据集2017
2025年12月21日 30 43 11
数据集概述 该数据集是基于2017年Lieberherr和Bodt研究的"科博瓦语比较词表"转换的CLDF格式数据集,包含科博瓦语核心词汇数据,支持语言比较与分类研究。 文件详解 文件名称:lexibank/lieberherrkhobwa-v2.1.zip 文件格式:ZIP压缩包...
-
Lexibank透明复合词提取数据集
2025年12月21日 30 49 13
数据集概述 本数据集为研究《Extracting Transparent Compounds from Lexibank》的配套代码与数据,用于从Lexibank中提取透明复合词,支持计算机辅助语言比较领域的相关分析。 文件详解 文件名称: extracting-compounds.zip 文件格式: ZIP (.zip) 文件内容:...
-
原始马来语词尾_r的反射形式数据集
2025年12月20日 30 140 108
数据集概述 本数据集为研究原始马来语(Proto-Malayic)词尾*-r的反射形式分布而汇编,包含未发表研究的核心数据与参考文献,支持语言学领域对马来语系语音演变的分析。 文件详解 Malayic *-r.csv:CSV格式数据文件,每条记录对应单个词汇及元数据与分析信息。核心字段包括: source:来源编码...
-
班图语基本词汇数据库2015
2025年12月20日 30 103 41
数据集概述 该数据集是基于Greenhill和Gray 2015年的"班图语基本词汇数据库"构建的CLDF格式数据集,包含班图语系的基本词汇数据,为班图语语言研究提供支持。 文件详解 文件名称: lexibank/bantubvd-v4.1.zip 文件格式: ZIP 内容说明:...
-
班巴拉语词典数据2018年11月
2025年12月20日 30 175 46
数据集概述 该数据集包含2018年11月在巴马科收集的41个精选班巴拉语词位的词典数据,采用Toolbox格式记录,标注了音位正字法、声调及词源等信息,为班巴拉语词汇研究提供基础资料。 文件详解 lexicon_2018-11_bamako.txt:TXT格式,Toolbox数据文件。包含词位核心信息,字段示例:...
-
土耳其语与乌兹别克语新趋势研究文档
2025年12月18日 30 151 134
数据集概述 该数据集包含一份关于土耳其语与乌兹别克语新趋势的研究文档,以PDF格式呈现,为语言研究领域提供相关主题的参考资料。 文件详解 文件名称:Shohsanam Tojiyeva.pdf 文件格式:PDF 内容说明:文档围绕土耳其语与乌兹别克语的新趋势展开,具体内容需通过阅读PDF文件获取 适用场景 土耳其语与乌兹别克语语言特征分析...
-
EDICTOR_3_交互式计算机辅助语言比较工具
2025年12月9日 30 151 148
数据集概述 本数据集包含EDICTOR工具的最新稳定版本(3.1版),该工具是一款用于计算机辅助语言比较的交互式软件,可通过edictor.org/直接使用。 文件详解 文件名称: digling/edictor-v3.1.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含EDICTOR 3.1版软件的完整文件,具体文件结构需解压后查看...



