标注版古兰经语料库

标注版古兰经语料库 数据来源:互联网公开数据
标签:古兰经,语音识别,关键词检测,文本标注,语音分析,宗教文本,语音合成

数据概述:
本数据集作为“Eqra'”项目的一部分,旨在将整部《古兰经》按单词进行手动分割。数据集从《法蒂哈》开始,提供每个单词的175个样本(每个样本来自不同的Sheikh),涵盖175个不同的声音样本。在版本2中,贡献者数量增加至220人,进一步丰富了数据的多样性。数据集中的每个样本均标注了单词的索引信息,并包含对应的音频文件,为关键词检测系统提供了高质量的训练和测试数据。

数据用途概述:
该数据集适用于语音识别、关键词检测、语音分析和语音合成等多种应用场景。研究人员和开发者可以利用此数据集训练和优化关键词检测模型,提升语音识别系统的准确性和鲁棒性。此外,数据集也适用于宗教文本的语音处理研究,为《古兰经》的语音合成和分析提供了宝贵的数据资源。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 637.56 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。