斯洛文尼亚语形容词形态标注数据库2024

数据集概述

本数据集包含斯洛文尼亚语中六千个最常用形容词的形态标注,基于Gigafida 2.0语料库2024年3月的抽样数据提取。标注涵盖词缀、复合结构、非派生性等核心形态特征,为斯洛文尼亚语形态学研究提供结构化数据支持。

文件详解

  • 文件名称: Annotated database of Slovenian adjectives.xlsx
  • 文件格式: Excel (.xlsx)
  • 字段映射: 包含ID(唯一编号)、Adjective(词元)、Frequency(词频)、Included(是否为有效形容词)、Suffix 1-7(后缀分解)、Ending(屈折词尾)、Prefixes(前缀标注)、Non-derived adjective(非派生性标记)、Zero(零派生标记)、Compound base(复合词基标记)、PTCP(分词标记)等字段。
  • 文件名称: Annotated database of Slovenian adjectives.pdf
  • 文件格式: PDF (.pdf)
  • 内容说明: 可能包含数据集的详细标注规则、附录及方法论说明,如词缀分解标准、音系条件变体处理原则等。

数据来源

Gigafida 2.0语料库

适用场景

  • 斯洛文尼亚语形态学研究: 分析形容词的派生结构、词缀组合规律及形态变化模式。
  • 自然语言处理应用: 为斯洛文尼亚语词性标注、词法分析等NLP任务提供训练数据或规则参考。
  • 语言学教学: 辅助斯洛文尼亚语语法教学,展示形容词形态构造的系统性特征。
  • 语言类型学对比: 对比其他斯拉夫语言形容词形态,探究语言间的共性与差异。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.47 MiB
最后更新 2025年12月13日
创建于 2025年12月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。