Multi_CAST_Nafsan_Based多语言口语文本标注语料库数据2311

数据集概述

本数据集为Multi-CAST多语言口语文本标注语料库的一部分,具体包含Nafsan语言的口语文本标注数据。该语料库由班贝格大学发布,属于Multi-CAST项目的2311版本,是多语言口语文本资源的重要组成部分。

文件详解

  • 压缩文件
  • 文件名称:mcnafsan-v2311.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含Multi-CAST Nafsan多语言口语文本标注语料库的相关数据,具体内容需解压后查看,无公开的README或内容预览。

数据来源

Thieberger, Nick & Brickell, Timothy. 2023. Multi-CAST Nafsan. In Haig, Geoffrey & Schnell, Stefan (eds.), Multi-CAST: Multilingual corpus of annotated spoken texts. Version 2311. Bamberg: University of Bamberg.

适用场景

  • 语言资源建设:用于多语言口语文本语料库的补充与完善,支持Nafsan语言的资源开发。
  • 语言学研究:为Nafsan语言的语音学、形态学等语言学研究提供标注语料支持。
  • 自然语言处理:作为多语言口语文本处理模型训练或测试的语料资源。
  • 语料库语言学分析:用于多语言口语文本语料库的对比分析与跨语言研究。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 359.98 MiB
最后更新 2026年1月15日
创建于 2026年1月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。