塞尔维亚语情态动词补语语料数据_2024

数据集概述

本数据集包含从塞尔维亚网络语料库(SrWaC)提取的1000条共现行,聚焦情态动词“morati”(必须)和“moći”(能够)的从句补语类型(不定式与da+现在时从句)。数据标注了情态语义、主语生命性、主语题元角色等语言学特征,用于研究塞尔维亚语情态结构中补语选择的影响因素。

文件详解

  • 文件名称:corpus data.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:
  • Preceding Context:目标情态动词前的文本
  • Target Modal:情态动词(morati或moći)
  • Following Context:目标情态动词后的文本
  • Modal Flavor:情态语义类型(deo义务/许可、epi认知、cir环境、dyn动态能力)
  • Complement Type:补语类型(INF不定式、DPC da+现在时从句)
  • Animacy:主语生命性(AN有生命、INAN无生命)
  • Subject Theta Role:主语题元角色(A施事、T主题、E体验者、I工具/原因)
  • Verb:情态动词本身(morati或moći)

数据来源

塞尔维亚网络语料库(SrWaC)、ClaCoLaSi Project Team

适用场景

  • 南斯拉夫语言从句补语研究:分析塞尔维亚语情态动词补语的句法变异规律
  • 情态动词句法行为研究:探究“morati”和“moći”的补语选择机制
  • 生命性与题元角色句法作用研究:验证主语属性对补语类型的影响
  • 情态动词结构跨语言比较:为不同语言情态补语系统的对比提供数据支持
  • 塞尔维亚语语法特征标注:作为自然语言处理任务中语法特征识别的训练数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.12 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。