找到11个数据集

标签: 乌拉尔语系

过滤结果
  • 萨米语_s_后缀动词派生词研究数据

    2026年2月15日 30 49 31

    数据集概述 本数据集是萨米语中带-s-(-šš-)后缀的动词派生词表格,以表格形式呈现各萨米语支中已证实的派生词。基础词默认以北萨米语形式给出,包含芬兰语或来源文献所用语言的近似含义,适用时标注Eliel Lagercranz《拉普兰词汇》(1939)的对应条目编号。数据集含3个文件。 文件详解 文件名称:South-Saami-esjidh.xlsx...
    packageimg
  • Benchmark_Database_语音对齐手动编辑基准数据

    2026年2月8日 30 22 13

    数据集概述 本数据集为语音对齐基准数据库,包含十五个压缩文件,涵盖斯拉夫语、法语、罗曼语等多种语言的手动编辑语音对齐数据,旨在为历史语言学和方言学领域的自动对齐算法提供测试与性能优化的基准平台,覆盖语音对齐分析中的典型问题。 文件详解 压缩文件组(archive_files)...
    packageimg
  • Saami_Based萨米语始动动词衍生类型表格数据_附录版

    2026年1月29日 30 44 27

    数据集概述 本数据集为萨米语始动动词研究的附录表格,记录各萨米语中基础动词衍生的始动动词类型及出现情况。基础动词以原始萨米语形式呈现,并附有芬兰语近似释义,包含一个Excel文件,是萨米语动词形态学研究的核心参考数据。 文件详解 文件名称:inkoatiivien-koonti.xlsx 文件格式:XLSX...
    packageimg
  • Zhivlov_Ob_Ugrian_Swadesh词表注释数据2011

    2026年1月22日 30 58 8

    数据集概述 本数据集基于Zhivlov于2011年发布的《Ob-Ugrian语族(乌拉尔语系)注释Swadesh词表》,由The Global Lexicostatistical Database提供。数据以压缩包形式存储,包含Ob-Ugrian语族的Swadesh词表注释内容,是研究该语族词汇特征的基础资料。 文件详解...
    packageimg
  • Proto_Uralic_Based_乌拉尔语同源词分布附录数据_2022

    2026年1月21日 30 94 87

    数据集概述 本数据集为论文《Drastic demographic events triggered the Uralic spread》的附录,包含精选的原始乌拉尔语(Proto-Uralic)同源词及其分布信息,用于支撑乌拉尔语系扩散相关的研究分析,共包含1个文件。 文件详解 文件名称:PU_cognates.xlsx 文件格式:XLSX...
    packageimg
  • Indo_Iranian_Uralic_Based_乌拉尔语系印伊语借词分布数据

    2026年1月19日 30 60 14

    数据集概述 本数据集是Grünthal等人2022年论文《Drastic demographic events triggered the Uralic spread》的附录,整理了乌拉尔语系中的早期印伊语借词及其分布情况,数据来源于赫尔辛基大学Samppa Holopainen 2019年博士论文。 文件详解...
    packageimg
  • Sentiment_Aligned_乌拉尔语系四语言情感分析与词嵌入数据_2023

    2026年1月15日 30 55 39

    数据集概述 本数据集包含厄尔兹亚语、科米-齐良语、莫克沙语和乌德穆尔特语四种乌拉尔语系语言的情感分析相关数据,包括对齐的情感标注数据、词嵌入向量、代码及情感分析模型,适用于低资源语言情感分析研究。 文件详解 情感标注数据文件 文件名称:sentiment_eval_data.json 文件格式:JSON...
    packageimg
  • 乌拉尔语系地理数据库

    2025年12月21日 30 22 4

    数据集概述 该数据集包含乌拉尔语系过去与当前分布的原始数字空间数据集及最终地图。数据由多机构资助的跨学科团队联合乌拉尔语专家收集,以矢量数据可视化语言分布,支持空间语言学及多学科研究,直观呈现乌拉尔语系及其方言的研究现状。 文件详解 文件名称:Geographical database of the Uralic languages.zip...
    packageimg
  • 萨米语_e_hče_高频动词表格

    2025年12月10日 30 18 16

    数据集概述 该数据集是一篇学术文章的附录表格,聚焦萨米语中的*-(e̮)hče̮-高频动词形式。数据以PDF格式呈现,为研究萨米语高频动词的形态特征提供了实证资料。 文件详解 文件名称: frekv-taulukko.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 乌拉尔语系基础词汇及同源词与借词信息数据集

    2025年12月7日 30 118 4

    数据集概述 该数据集提供乌拉尔语系的基础词汇数据,包含同源词与借词相关信息,可用于分析语言间的词汇借用模式及结构特征,为语言学研究提供支持。 文件详解 文件名称: lexibank/uralex-v2.0.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含乌拉尔语系基础词汇数据,具体字段及结构需解压后查看原始文件 适用场景...
    packageimg
  • 乌拉尔语系类型学数据库UraTyp

    2025年12月4日 30 198 39

    数据集概述 该数据集为乌拉尔语系类型学数据库(UraTyp),包含与乌拉尔语系语言类型学相关的综合数据,数据以压缩包形式存储,未提供文件内容预览信息。 文件详解 文件名称: cldf-datasets/uratyp-v1.1.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg