语音识别WER结果数据集

语音识别WER结果数据集

数据来源:互联网公开数据

标签:语音识别,WER,Whisper模型,古兰经数据集,增强前采样,结果分析,模型评估

数据概述: 本数据集包含使用Transformers Whisper模型对古兰经数据集(resample_before_augmentation_dataset)进行训练,达到第5个epoch时的WER(字错误率)结果文件。数据集主要由三类CSV文件组成:{sheikh}_per_ayah.csv、{sheikh}_per_sorah.csv和{sheikh}_total.csv,分别记录了不同诵读者(sheikh)在每个章节(ayah)、每个卷章(sorah)以及整体的WER值。数据集可用于评估模型在不同诵读风格和文本长度下的表现。

数据用途概述: 该数据集适用于语音识别模型的性能评估和优化研究。研究人员可以通过分析不同诵读者和文本部分的WER值,了解模型在复杂语音数据上的表现差异,识别潜在的改进方向。数据集也适用于模型训练的对比分析,帮助研究人员选择更优的预处理策略(如增强前采样)或调整模型参数。此外,数据集还可用于教育和培训场景,帮助学习者理解语音识别技术的评估指标和方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.66 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。