找到13个数据集

标签: 语言类型学

过滤结果
  • 乌拉尔语系基础词汇及同源词与借词信息数据集

    2025年12月7日 30 106 5

    数据集概述 该数据集提供乌拉尔语系的基础词汇数据,包含同源词与借词相关信息,可用于分析语言间的词汇借用模式及结构特征,为语言学研究提供支持。 文件详解 文件名称: lexibank/uralex-v2.0.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含乌拉尔语系基础词汇数据,具体字段及结构需解压后查看原始文件 适用场景...
    packageimg
  • 多成分复合句综合分析数据集

    2025年12月7日 30 179 21

    数据集概述 该数据集围绕多成分复合句展开综合分析,核心内容为一份PDF格式的研究文档,为语法结构、句子类型等语言研究方向提供基础资料。 文件详解 文件名称:Nazarova Sevarakhon Jakhongir kizi.pdf 文件格式:PDF 内容说明:包含关于多成分复合句的综合性分析内容,具体字段或章节需通过文档阅读获取 适用场景...
    packageimg
  • 克里奥尔语与非克里奥尔语类型学差异研究数据集

    2025年12月7日 30 80 56

    数据集概述 本数据集为支持《Creoles are typologically distinct from non-creoles》一文分析的补充材料,包含基于Hancock(1987)、Holm & Patrick(2007)及Parkvall(2008)研究的特征定义与数据集摘要,为克里奥尔语类型学研究提供数据支持。 文件详解 文件名称:...
    packageimg
  • 杜洪比语音学_非母语及边缘音位起源数据集

    2025年12月6日 30 205 37

    数据集概述 本数据集是杜洪比语法中2.2.1、2.2.2、4.10.1及4.10.2章节的补充材料,聚焦于杜洪比语中非母语及边缘辅音、元音音位的起源,为语音学研究提供原始参考数据。 文件详解 压缩文件: DZ.7z: 7z格式压缩文件,内容未明确说明,可能包含与特定音位相关的原始数据或分析材料 LH.zip:...
    packageimg
  • 英俄双语空间概念表达单元语义描述研究

    2025年12月6日 30 99 37

    数据集概述 本数据集为一份PDF文档,核心内容围绕英语和乌兹别克语中表达空间概念的语言单元的语义特征展开研究,可能包含两种语言空间概念表达的对比分析或语义描述框架。 文件详解 文件名称: Nizomova Nargiza Aliyevna.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 语言学华莱士地区可分不可让渡编码补充材料数据集

    2025年12月6日 30 87 12

    数据集概述 本数据集为论文《语言学华莱士地区可分不可让渡编码:类型学、起源与传播》的补充材料,包含用于研究的数据集文件及样本语言和来源说明文档,支持对该语言学现象的分析与验证。 文件详解...
    packageimg
  • 英语与其他语言功能动词形式比较分析数据集

    2025年12月6日 30 137 69

    数据集概述 本数据集聚焦于英语与其他语言功能动词形式的比较分析,包含相关研究内容的文档资料,为语言对比研究提供数据支持。 文件详解 文件名称:N.Djumaeva.pdf 文件格式:PDF (.pdf) 内容说明:该文档围绕英语与其他语言的功能动词形式展开比较分析,具体内容需查阅文档原文 适用场景 语言学研究:分析不同语言功能动词形式的差异与共性...
    packageimg
  • 缅语族语言词汇数据机器可读集合

    2025年12月5日 30 13 12

    数据集概述 本数据集包含缅语族语言的词汇列表,大部分词汇已按WordNet进行语义标准化,全面整合了已发表的缅语族语言数据,为缅语族语言词汇研究提供机器可读的基础数据支持。 文件详解 压缩文件集合: burmish.list.zip:词汇列表压缩文件 burmish.table.zip:表格形式的词汇数据压缩文件...
    packageimg
  • 世界语言前缀后缀偏好自动提取数据集2021

    2025年12月4日 30 189 169

    数据集概述 本数据集为2021年SIGTYP会议论文《Measuring Prefixation and Suffixation in the Languages of the World》的配套数据,包含全球语言中前缀与后缀偏好的自动提取数据,为语言形态学研究提供支持。 文件详解 psst2021mrt.tab:...
    packageimg
  • DIG4EL通用智能体116种语言规范词序测试结果数据集

    2025年12月4日 30 131 41

    数据集概述 该数据集包含DIG4EL通用智能体(GA)针对116种语言规范词序的测试结果。智能体基于7个可自动观测的词序参数,推断8个未知词序参数,采用留一法(Leave-One-Out)测试,每种语言独立测试11个轮次(epochs),数据为软件输出的原始真值表。 文件详解 文件名称: truth_tables.zip 文件格式:...
    packageimg
  • 乌拉尔语系类型学数据库UraTyp

    2025年12月4日 30 166 145

    数据集概述 该数据集为乌拉尔语系类型学数据库(UraTyp),包含与乌拉尔语系语言类型学相关的综合数据,数据以压缩包形式存储,未提供文件内容预览信息。 文件详解 文件名称: cldf-datasets/uratyp-v1.1.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 世界借词数据库衍生CLDF数据集2009

    2025年12月4日 30 149 138

    数据集概述 该数据集是基于2009年Haspelmath和Tadmor主编的《世界借词数据库》生成的CLDF格式数据集,为语言研究领域提供标准化的借词数据支持。 文件详解 文件名称: lexibank/wold-v4.1.zip 文件格式: ZIP压缩包 内容说明: 包含基于《世界借词数据库》衍生的CLDF格式数据,具体字段信息需解压后查看原始数据结构...
    packageimg
  • 通用依存树库动词得分附录数据集

    2025年12月4日 30 63 8

    数据集概述 该数据集聚焦通用依存树库(UD)覆盖的样本语言,呈现主句与状语从句中动词得分(一至三分)的分布情况,通过PDF文件提供可视化或结构化数据支持。 文件详解 文件名称:advcl6-UD.pdf 文件格式:PDF 内容说明:包含通用依存树库样本语言中,主句与状语从句的动词得分(1-3分)的图表或数据表格,具体字段映射需查看文件内容 适用场景...
    packageimg