数据集概述
本数据集为Multi-CAST Arta多语言口语标注文本语料库,是Multi-CAST项目的一部分,收录于《Multi-CAST: Multilingual corpus of annotated spoken texts》第2311版本中。数据以压缩包形式提供,包含多语言口语文本的标注内容,适用于语言学领域的多语言口语研究。
文件详解
- 压缩包文件
- 文件名称:mcarta-v2311.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含Multi-CAST Arta多语言口语标注文本数据,具体内部文件结构及字段需解压后查看,原数据未提供预览信息。
数据来源
Kimoto, Yukinori. 2023. Multi-CAST Arta. In Haig, Geoffrey & Schnell, Stefan (eds.), Multi-CAST: Multilingual corpus of annotated spoken texts. Version 2311. Bamberg: University of Bamberg.
适用场景
- 多语言口语语料库研究: 用于分析不同语言口语文本的标注特征与结构。
- 语言学标注标准研究: 探究多语言口语文本的标注规范与方法。
- 口语语言学分析: 支持多语言口语数据的语言学特征提取与比较研究。
- 语料库语言学资源建设: 作为多语言口语语料库的补充资源,服务于相关学术研究。