Multi_CAST_Arta_Based多语言口语标注文本数据集2311

数据集概述

本数据集为Multi-CAST Arta多语言口语标注文本语料库,是Multi-CAST项目的一部分,收录于《Multi-CAST: Multilingual corpus of annotated spoken texts》第2311版本中。数据以压缩包形式提供,包含多语言口语文本的标注内容,适用于语言学领域的多语言口语研究。

文件详解

  • 压缩包文件
  • 文件名称:mcarta-v2311.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含Multi-CAST Arta多语言口语标注文本数据,具体内部文件结构及字段需解压后查看,原数据未提供预览信息。

数据来源

Kimoto, Yukinori. 2023. Multi-CAST Arta. In Haig, Geoffrey & Schnell, Stefan (eds.), Multi-CAST: Multilingual corpus of annotated spoken texts. Version 2311. Bamberg: University of Bamberg.

适用场景

  • 多语言口语语料库研究: 用于分析不同语言口语文本的标注特征与结构。
  • 语言学标注标准研究: 探究多语言口语文本的标注规范与方法。
  • 口语语言学分析: 支持多语言口语数据的语言学特征提取与比较研究。
  • 语料库语言学资源建设: 作为多语言口语语料库的补充资源,服务于相关学术研究。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 812.64 MiB
最后更新 2026年1月21日
创建于 2026年1月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。