-
CLDF_Based_1853年Mentawei群岛数字词汇比较数据集_2_0_0版
2026年1月18日 30 20 12
数据集概述 本数据集基于Carl Benjamin Hermann von Rosenberg1853年发表的《De Mentawei-Eilanden en Hunne Bewoners》文献,提取并整理为CLDF格式的比较数字词汇数据,用于研究Mentawei群岛语言中的数字系统特征,当前为2.0.0版本,包含1个压缩文件。 文件详解...
-
Swadesh_Sranan_Tongo_Core_Vocabulary_Evolution_Data
2026年1月2日 30 118 58
数据集概述 本数据集为硕士论文研究制作,包含斯瓦迪士207词核心词汇表中早期与现代苏里南语(Sranan Tongo)的词汇对比数据,涵盖词性、语义类别、来源语言及语义和词汇变化信息,共包含1个文件。 文件详解 文件名称:Main and extended tables for the 207-word Swadesh list of Early...
-
现代汉语方言核心词特征词集CLDF数据集2007
2025年12月14日 30 86 45
数据集概述 该数据集基于2007年《现代汉语方言核心词·特征词集》构建,采用CLDF格式存储,包含现代汉语方言的核心词汇与特征词数据,为方言词汇研究提供结构化资源。 文件详解 文件名称:lexibank/liusinitic-v1.4.zip 文件格式:ZIP压缩包...
-
全球十大最常用口语统计数据集
2025年12月8日 30 22 17
数据集概述 该数据集基于GeoNames平台信息,整理了全球十大最常用口语的统计数据,同时包含因国家分合、语言消亡等因素需留存的相关信息,为语言分布及演变研究提供数据支持。 文件详解 文件名称: countryInfo.txt,文件格式: TXT 内容预览:...
-
图皮语词汇数据库
2025年12月8日 30 60 10
数据集概述 该数据集为图皮语词汇数据库(TuLeD),包含图皮语系语言的词汇资源,以压缩文件形式存储,未划分训练测试、数据标签或原始处理数据,为语言研究提供基础词汇数据支持。 文件详解 文件名称:tupian-language-resources/tuled-v0.12.zip 文件格式:ZIP压缩包(.zip)...



