跨语言数词系统构成结构数据集2025

数据集概述

该数据集呈现了2025年Rubehn等人关于跨语言数词系统构成结构的研究成果,包含数词系统构成结构的标注与推理相关数据,为计算语言类型学和多语言自然语言处理研究提供支持。

文件详解

  • 文件名称:numeralbank/cosinus-v1.1.zip
  • 文件格式:ZIP压缩包(.zip)
  • 文件内容:该压缩包为数据集的唯一文件,包含跨语言数词系统构成结构相关的研究数据,具体字段及内容需解压后查看

数据来源

Rubehn, A., C. Rzymski, L. Ciucci, K. van Dam, A. Kučerová, K. Bocklage, D. Snee, A. Stephen, and J.-M. List(待发表):Annotating and Inferring Compositional Structures in Numeral Systems Across Languages. In: Proceedings of the 7th Workshop on Research in Computational Linguistic Typology and Multilingual NLP (SIGTYP 2025). 1-13. https://doi.org/10.48550/arXiv.2503.01625

适用场景

  • 计算语言类型学研究:分析不同语言数词系统的构成结构特征
  • 多语言自然语言处理:支撑数词系统相关的模型训练与推理任务
  • 语言比较研究:探究跨语言数词系统的共性与差异
  • 语言资源建设:补充数词系统领域的结构化标注数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.79 MiB
最后更新 2025年12月4日
创建于 2025年12月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。