-
昂库语族初步调查数据集
数据集概述 本数据集围绕昂库语族(属于南亚语系孟高棉语支)展开初步调查,包含未记录语言的词汇、语音数据及地理分布信息,为研究该语族分类、语言特征及演化提供基础资料。 文件详解 文件名称:AngkuicComparative.xlsx 文件格式:Excel(.xlsx) 内容说明:可能包含昂库语族不同语言的词汇比较数据表 文件名称:Angkuic2...
-
Objaverse_Ballinrannig_VII_Based_欧甘石碑三维数字化文化遗产数据
数据集概述 该数据集包含Ballinrannig VII欧甘石碑的相关文件,涵盖通过摄影测量及Agisoft PhotoScan处理生成的3D模型与图片文件,为研究古代欧甘铭文及石碑实体特征提供数据支持。 文件详解 图片文件(.jpeg格式,共7个):包含thumb0.jpeg至thumb6.jpeg等7个缩略图文件,用于直观展示石碑外观特征...
-
词中附着词类型学研究会议讲稿2016
数据集概述 本数据集为2016年莫斯科举办的“形态句法参数类型学”会议讲稿草稿,聚焦词中附着词的参数理论发展,基于10种语言/方言案例提出核心观点:词中附着词存在,但非由附着词固有特征触发,而是特定形态附着词基在句法位置再分析的结果。 文件详解 文件名称:Endoclitics 2026.pdf 文件格式:PDF(.pdf)...
-
所罗门群岛语言内部分类CLDF数据集1983
数据集概述 该数据集是基于Tryon和Hackman1983年发表的《Solomon Islands Languages: An internal classification》构建的CLDF格式数据集,包含所罗门群岛语言的内部分类相关数据,为语言分类研究提供支持。 文件详解 文件名称:lexibank/tryonsolomon-v3.1.zip...
-
埃塞俄比亚母语分布1976年地图数据集
数据集概述 该数据集包含1976年出版的埃塞俄比亚母语分布地图,重点展示提格利尼亚语的地理分布范围,包括其与苏丹边境、东非大裂谷悬崖的位置关系,以及跨默勒布河、特克泽河的分布情况,同时标注库纳马语的分布区域。 文件详解 文件名称: Distribution of Mother Tongues 1976 v2.pdf 文件格式: PDF 内容说明:...
-
晚期古俄语与古俄语时期附着词系统研究
数据集概述 本数据集是基于2017年12月1日在俄罗斯科学院语言学研究所“小词(话语词)”会议上的演讲修订而成的研究资料,聚焦晚期古俄语与古俄语时期附着词的聚类、模板及辖域现象等核心问题。 文件详解 文件名称:Late_Old_Russian_clitics_pdf.pdf 文件格式:PDF...
-
阿坎语特维方言阿桑特变体短语动词使用数据集2018
数据集概述 本数据集是2018年柏林洪堡大学“城市田野调查”研讨会的项目成果,聚焦加纳阿坎语特维方言阿桑特变体中(emu)ye den、(emu)ye duru和(emu)ye hare三个短语动词的使用情况,包含相关注释语句、斯瓦迪士核心词表词汇及配套调查材料。 文件详解 该数据集包含16个文件,具体说明如下: - 文档类文件(PDF格式): -...
-
d_Prose德语文学散文文本数据集1870_1920
数据集概述 该数据集包含1870至1920年间出版的2511篇德语文学散文文本,涵盖通俗与高雅文学叙事,单篇文本不少于1000词。数据集经去重、去副文本处理,提供纯文本文件及元数据表格,支持自动化文本分析。 文件详解 文件名称:...
-
IN00050戈帕拉贾埃兰柱铭文
数据集概述 该数据集包含关于戈帕拉贾埃兰柱铭文的文献资料,铭文编号为IN00050,内容源自《早期笈多国王铭文》一书,为研究该历史铭文提供了基础文献支持。 文件详解 文件名称: IN00050 Eran Pillar Inscription of Goparaja.pdf 文件格式: PDF (.pdf) 文件内容:...
-
哥伦比亚原住民语言比较词汇数据集1992
数据集概述 该数据集基于1992年Huber与Reed的《哥伦比亚原住民语言比较词汇》研究,以CLDF格式整理了哥伦比亚原住民语言的精选词汇数据,为语言比较研究提供结构化支持。 文件详解 文件名称:lexibank/hubercolumbian-v4.0.2.zip 文件格式:ZIP压缩包...
-
基于Satterthwaite_Phillips2011年藏缅语系语言系统发育推断的CLDF数据集
数据集概述 该数据集是基于Satterthwaite-Phillips2011年关于藏缅语系语言系统发育推断的研究生成的CLDF格式数据集,包含相关语言演化分析的核心数据,为藏缅语系语言分类研究提供支持。 文件详解 文件名称:lexibank/satterthwaitetb-v4.0.zip 文件格式:ZIP压缩包...
-
桦树皮信件中的斯堪的纳维亚人名_语音与非语音特征
数据集概述 本数据集包含一篇学术论文,聚焦于古俄罗斯桦树皮信件中斯堪的纳维亚人名的语音与非语音特征分析。论文探讨了如Свѣнь、Стѣнь等借用人名的词尾腭化现象,以及Дрозьдъ作为斯堪的纳维亚人名Þröstr的仿译词分析,为研究古斯堪的纳维亚语发音及文化交流提供数据支持。 文件详解 文件名称:37887018.pdf 文件格式:PDF(.pdf)...
-
CLICS1_0数据库底层数据集
数据集概述 该数据集为原始CLICS数据库的底层数据,由四个来源整合而成。现提供此数据以方便用户快速访问,因CLICS 1.0已被新版CLICS²数据库取代。数据包含LingPy库规范的原始词表格式和CLDF格式,支持在CLICS²新API中复用。 文件详解 文件名称: clics1-1.1.zip 文件格式: ZIP压缩包 内容说明:...
-
古俄语晚期话语助词与附着词簇研究数据集
数据集概述 本数据集聚焦古俄语晚期(十六至十七世纪及十八世纪初)文本中的话语助词与附着词簇,探讨其句法与语义特征,分析该时期附着词系统对早期古俄语聚类原则的保留程度。 文件详解 文件名称: ZE_LI_or_LI_ZE_discourse_particles_and_c (1).pdf 文件格式: PDF (.pdf) 文件内容:...
-
Glottolog数据库5_2_1_CLDFF格式数据集
数据集概述 该数据集为Glottolog数据库5.2.1版本的CLDF格式归档文件,包含语言研究相关数据,由Max Planck Institute for Evolutionary Anthropology发布,可通过指定链接获取。 文件详解 文件名称: glottolog-cldf-v5.2.1.zip 文件格式: ZIP压缩包 内容说明:...
-
跨语言共现词数据库CLICS3
数据集概述 该数据集为CLICS3(跨语言共现词数据库第三版),包含跨语言词汇共现现象的相关数据,支持对跨语言多义性的可重复分析,为语言学领域研究词汇语义关联提供数据基础。 文件详解 文件名称: clics3-v1.1.zip 文件格式: ZIP (.zip) 内容说明:...
-
Barlow南岛语系_手_与_五_共指现象消失研究CLDF数据集
数据集概述 该数据集为CLDF格式,包含Barlow关于南岛语系中"手"与"五"共指现象消失研究的相关数据及补充材料,支持对语言演变规律的分析。 文件详解 文件名称:cldf-datasets/barlowhandandfive-v1.3.zip 文件格式:ZIP压缩包...
-
北京方言声调演变数据集1900至今
数据集概述 该数据集包含1900年至今北京方言单字调的原始提取数据,来源于早期录音资料和实验研究结果,为分析北京方言声调的历史演变提供实证数据支持。 文件详解 该数据集以压缩包形式提供,具体说明如下: - 压缩包文件: - EL-CL/beijing-tones-since-1900-v1.0.zip: ZIP格式压缩包,包含所有提取的CSV数据文件...
-
范妮_门德尔松致威廉_亨塞尔书信转录数据集
数据集概述 本数据集包含范妮·门德尔松致丈夫威廉·亨塞尔的122封书信转录内容,源自柏林国家图书馆的两文件夹藏品,共250页、2240行文本,以PAGE、ALTO及基础TEI格式存储,支持历史书信研究与手写文本识别模型训练。 文件详解 文件名称:1878144588.zip、1878121294.zip 文件格式:ZIP压缩包...
-
古希腊与拉丁语翻译对齐标注指南及黄金标准数据集
数据集概述 本数据集包含古希腊文本与拉丁语学术翻译对齐的标注指南及黄金标准,涵盖100条随机选自Digital Fragmenta Historicorum Graecorum的片段,由专家手动对齐,标注者间一致性达90.5%,可用于翻译对齐任务的执行、评估及模型训练。 文件详解 核心文件:...



