数据集

标注版古兰经语料库

标注版古兰经语料库数据来源：互联网公开数据
标签：古兰经,语音识别,关键词检测,文本标注,语音分析,宗教文本,语音合成

数据概述：
本数据集作为“Eqra'”项目的一部分，旨在将整部《古兰经》按单词进行手动分割。数据集从《法蒂哈》开始，提供每个单词的175个样本（每个样本来自不同的Sheikh），涵盖175个不同的声音样本。在版本2中，贡献者数量增加至220人，进一步丰富了数据的多样性。数据集中的每个样本均标注了单词的索引信息，并包含对应的音频文件，为关键词检测系统提供了高质量的训练和测试数据。

数据用途概述：
该数据集适用于语音识别、关键词检测、语音分析和语音合成等多种应用场景。研究人员和开发者可以利用此数据集训练和优化关键词检测模型，提升语音识别系统的准确性和鲁棒性。此外，数据集也适用于宗教文本的语音处理研究，为《古兰经》的语音合成和分析提供了宝贵的数据资源。

数据与资源

标注版古兰经语料库.zipZIP
637.56 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	637.56 MiB
最后更新	2025年5月31日
创建于	2025年5月31日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

标注版古兰经语料库

数据与资源

附加信息

注册成功！