数据集

Multi_CAST_Source_Northern_Kurdish多语言语音文本标注数据2311

数据集概述

本数据集为Multi-CAST多语言语音文本标注语料库的一部分，包含Northern Kurdish语言的语音文本标注数据。该语料库由班贝格大学发布，是多语言口语文本标注资源的重要组成，可用于相关语言研究与自然语言处理应用。

文件详解

文件名称：Multi-CAST/mcnkurd-v2311.zip
文件格式：ZIP
字段映射介绍：未提供具体字段映射信息，文件为压缩包格式，内含Northern Kurdish语言的语音文本标注数据。

数据来源

Haig, Geoffrey & Vollmer, Maria & Thiele, Hanna. 2023. Multi-CAST Northern Kurdish. In Haig, Geoffrey & Schnell, Stefan (eds.), Multi-CAST: Multilingual corpus of annotated spoken texts. Version 2311. Bamberg: University of Bamberg.

适用场景

多语言语音文本研究: 用于分析Northern Kurdish语言的语音文本特征及标注体系。
自然语言处理模型训练: 为Northern Kurdish语言的语音识别、文本标注等自然语言处理任务提供训练数据。
语言学研究: 支持对Northern Kurdish语言结构、语法及口语特征的学术研究。
多语言语料库资源整合: 作为Multi-CAST多语言语料库的一部分，用于跨语言对比分析与资源整合。

数据与资源

14859603.zipZIP
230.73 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	230.73 MiB
最后更新	2026年1月7日
创建于	2026年1月7日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。