-
西班牙语复合时态变体研究数据集
2026年2月12日 30 15 3
数据集概述 本数据集聚焦西班牙语复合时态的变体研究,包含11个Excel文件,覆盖bemos_beis、sincretismo_hemos_hamos等不同语法变体主题,为西班牙语语法变体分析提供结构化数据支持。 文件详解 文件名称:bemos_beis.xlsx 文件格式:XLSX...
-
北萨米语广播字幕语料库_2021_2024
2026年2月1日 30 165 152
数据集概述 本数据集为北萨米语YLE Areena字幕语料库,包含2021年3月31日至2024年11月15日期间从YLE Sápmi广播收集的北萨米语字幕句子,涵盖完整句子、句子ID及来源元数据,可用于北萨米语语言研究与资源开发。 文件详解 文件名称:sami_subtitles.json 文件格式:JSON...
-
Dogon_ATR_Based多贡语比较词干数据
2026年2月9日 30 142 107
数据集概述 本数据集包含多贡语(Dogon languages)间的ATR(高级舌冠根Advanced Tongue Root)比较词干数据,旨在为语言学研究提供多贡语族内词汇形态的对比分析基础。数据集仅包含一个文档文件。 文件详解 文件名称:Dogon ATR appendix.docx 文件格式:DOCX...
-
Fischer_2018_德语方言语法与过去时消失现象研究数据
2026年1月29日 30 121 71
数据集概述 本数据集整理了244个德语方言语法和语法方言描述的标题,均选自Fischer(2018)中用于分析德语过去时消失现象的文献。数据包含语法的短标题、全标题、GND编号(若有)、对应方言区域、地图标注信息、REDE SprachGIS-GID(若有)及按Fischer(2018)分类的过去时消失类别,为研究德语方言演变提供结构化参考。 文件详解...
-
AfBo_Based_词缀借用全球调查数据集2013
2026年1月31日 30 175 57
数据集概述 本数据集为2013年发布的AfBo全球词缀借用调查数据,由Frank Seifart完成,记录了全球范围内语言词缀借用现象的调查内容,可通过指定在线链接获取,包含1个压缩文件。 文件详解 文件名称:waab-v2013.zip 文件格式:ZIP(压缩文件) 字段映射介绍:未提供具体字段信息,文件为压缩包格式,内部内容需解压后查看 数据来源...
-
LAGT_Based_多源整合古希腊文本语料库_v4_1
2026年1月30日 30 123 36
数据集概述 本数据集为LAGT(lemmatized ancient Greek texts)古希腊文本语料库,整合自Perseus数字图书馆、First 1000 Years of...
-
CLDF_Ivani_Suansu基础词汇数据集2019
2026年1月30日 30 110 37
数据集概述 本数据集是基于Ivani 2019年关于印度东北部藏缅语族语言Suansu的基础词汇研究形成的CLDF格式数据集,核心内容为Suansu语言的基础词汇信息,为语言研究提供结构化资源。 文件详解 文件名称:lexibank/ivanisuansu-v2.0.zip 文件格式:ZIP...
-
Chacon_2022_西北阿拉瓦克语族注释斯瓦迪士词表数据集
2026年1月29日 30 125 36
数据集概述 本数据集为Chacon于2022年发布的西北阿拉瓦克语族注释斯瓦迪士词表CLDF数据集,包含1个压缩文件,存储于单一目录下,无训练测试或原始处理数据拆分,主要用于语言进化与比较语言学研究。 文件详解 压缩文件 文件名称:lexibank/chaconnorthwestarawakan-v1.0.zip 文件格式:ZIP...
-
IN02053_Based_巴希利托勒铭文梵语XML草稿版数据
2026年1月29日 30 130 125
数据集概述 本数据集包含IN02053号巴希利托勒铭文(位于帕坦)的梵语文本,以XML格式存储,为Epidoc标准的草稿版本,将纳入“Siddham”存档。数据无元数据,共包含一个文件,是研究该铭文文本内容的基础数字化资料。 文件详解 文件名称:IN02053.xml 文件格式:XML...
-
imp_20220324_日琉方言命令禁止表现调查数据_压缩包
2026年1月28日 30 170 118
数据集概述 本数据集包含日琉方言命令与禁止表现的调查票及调查结果,覆盖宫城、茨城、千叶等日本多地及冲绳与那国岛的10种方言,每种方言对应明确报告者。数据用于方言命令禁止表现的描述与对照研究,包含相关调查报告PDF。 文件详解 文件名称:imp_20220324.zip 文件格式:ZIP...
-
Central_Loloish_Based_语言词汇同言线数据库
2026年1月28日 30 157 150
数据集概述 本数据集为Central Loloish(Ngwi)语言的潜在词汇同言线数据库,聚焦该语系语言中的词汇同言线现象,提供结构化数据支持语言学研究。数据集包含1个文件,无目录层级划分,未区分训练/测试、数据/标签或原始/处理数据。 文件详解 文件名称:Central_Loloish_lexical_isogloss_database.xlsx...
-
CLDF_JIPA_Based_IPA期刊音位清单数据集2021
2026年1月28日 30 71 55
数据集概述 本数据集为CLDF格式,包含从《国际语音协会期刊》(Journal of the IPA)中提取的音位清单数据,由Baird等人于2021年整合。数据基于《北风与太阳》文本采样,可用于语言学领域中音位系统的研究与分析,共包含一个压缩文件。 文件详解 文件名称:cldf-datasets/jipa-v1.0.zip 文件格式:ZIP...
-
IN01027_Based_Hiresakuna梵语授权文书数字化数据
2026年1月26日 30 186 115
数据集概述 本数据集为IN01027号Hireśakuna授权文书的梵语XML文件,记录了Mṛgeśavarman统治第八年的授权内容,未包含元数据。数据集仅含一个文件,用于古文献数字化保存与研究。 文件详解 文件名称:IN01027.xml 文件格式:XML...
-
linhd_postdata_Based_Poesi_as诗歌语料库_公开数据集
2026年1月19日 30 139 110
数据集概述 本数据集为Poesi.as网站的诗歌语料库,包含以西班牙语为主的诗歌作品,覆盖21世纪及以前的创作,总计25,187首诗歌、7,918,679个词汇。提供诗歌文本JSON文件、作者信息CSV文件及公共领域诗歌提取脚本,支持西班牙语文学相关研究与分析。 文件详解 主数据集压缩包 文件名称:linhd-...
-
Plomley_Source_塔斯马尼亚语言研究原始数据_1976版
2026年1月23日 30 3 0
数据集概述 本数据集是对NJB Plomley 1976年整理发布的塔斯马尼亚语言相关资料的数字化处理结果,包含词汇数据、记录者信息、语言使用者信息等核心内容,经授权分发,为塔斯马尼亚语言研究提供结构化数据支持。 文件详解 Band names文件 文件名称:TAS-Bandnames.xlsx 文件格式:XLSX...
-
IN01011_Source_Sudevaraja宪章梵语XML数据
2026年1月23日 30 11 1
数据集概述 本数据集包含IN01011号Sudevaraja的Sirpur宪章梵语文本,以XML格式存储,无元数据。数据集仅含一个文件,无目录层级划分,无训练/测试、数据/标签或原始/处理数据的拆分,文件类型单一为XML。 文件详解 文件名称:IN01011.xml 文件格式:XML...
-
Invisible_East_Based_中世纪阿富汗及周边多语言文献JSON数据集
2026年1月18日 30 159 113
数据集概述 本数据集为Invisible East Digital Corpus的JSON格式版本,包含公元4/10世纪至7/13世纪中世纪阿富汗及周边地区的多语言文献,涵盖新波斯语、中古波斯语、阿拉伯语等语言,提供高清图像、转录及翻译内容,适用于计算分析与数字保存。 文件详解 文件名称:iedc_2025-08-07_18-07.json...
-
Ume_Saami_Dictionary_Comparison_Data
2026年1月22日 30 114 28
数据集概述 本数据集为书评《A new general dictionary of Ume Saami》的配套表格,展示Schlachter 1958年与Barruk 2018年版Ume萨米语词典的差异。数据对齐两版词典中以v开头的词条,呈现词汇的共性与差异,支持语言词汇演变研究。 文件详解 文件名称:ume-MalaLpW-Barruk-...
-
CLDF_Based_Gran_Chaco区域语言比较词表数据集2022
2026年1月22日 30 203 180
数据集概述 本数据集为CLDF格式,对应Brid等人2022年发布的《Gran Chaco区域语言比较词表》,包含该区域语言的比较词表信息,是研究Gran Chaco地区语言特征的结构化数据资源,共含一个文件。 文件详解 压缩包文件 文件名称:lexibank/chacolanguages-v0.3.zip 文件格式:ZIP...
-
Sino_Tibetan_Based_汉藏语系降雨表达类型学研究辅助数据
2026年1月21日 30 115 87
数据集概述 本数据集为汉藏语系降雨表达类型学研究的补充数据,核心内容围绕汉藏语系语言中降雨相关表达的类型学特征展开,支持对该语言现象的系统性分析。数据集包含1个文件,整体结构简单,无目录层级划分。 文件详解 文件名称:Rain in ST supplementary data.xlsx 文件格式:XLSX...



