数据集

Multi_CAST_Arta_Based多语言口语标注文本数据集2311

数据集概述

本数据集为Multi-CAST Arta多语言口语标注文本语料库，是Multi-CAST项目的一部分，收录于《Multi-CAST: Multilingual corpus of annotated spoken texts》第2311版本中。数据以压缩包形式提供，包含多语言口语文本的标注内容，适用于语言学领域的多语言口语研究。

文件详解

压缩包文件
文件名称：mcarta-v2311.zip
文件格式：ZIP
字段映射介绍：压缩包内包含Multi-CAST Arta多语言口语标注文本数据，具体内部文件结构及字段需解压后查看，原数据未提供预览信息。

数据来源

Kimoto, Yukinori. 2023. Multi-CAST Arta. In Haig, Geoffrey & Schnell, Stefan (eds.), Multi-CAST: Multilingual corpus of annotated spoken texts. Version 2311. Bamberg: University of Bamberg.

适用场景

多语言口语语料库研究: 用于分析不同语言口语文本的标注特征与结构。
语言学标注标准研究: 探究多语言口语文本的标注规范与方法。
口语语言学分析: 支持多语言口语数据的语言学特征提取与比较研究。
语料库语言学资源建设: 作为多语言口语语料库的补充资源，服务于相关学术研究。

数据与资源

14857715.zipZIP
812.64 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	812.64 MiB
最后更新	2026年1月21日
创建于	2026年1月21日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。