数据集

语音识别WER结果数据集

数据来源：互联网公开数据

标签：语音识别,WER,Whisper模型,古兰经数据集,增强前采样,结果分析,模型评估

数据概述：本数据集包含使用Transformers Whisper模型对古兰经数据集（resample_before_augmentation_dataset）进行训练，达到第5个epoch时的WER（字错误率）结果文件。数据集主要由三类CSV文件组成：{sheikh}_per_ayah.csv、{sheikh}_per_sorah.csv和{sheikh}_total.csv，分别记录了不同诵读者（sheikh）在每个章节（ayah）、每个卷章（sorah）以及整体的WER值。数据集可用于评估模型在不同诵读风格和文本长度下的表现。

数据用途概述：该数据集适用于语音识别模型的性能评估和优化研究。研究人员可以通过分析不同诵读者和文本部分的WER值，了解模型在复杂语音数据上的表现差异，识别潜在的改进方向。数据集也适用于模型训练的对比分析，帮助研究人员选择更优的预处理策略（如增强前采样）或调整模型参数。此外，数据集还可用于教育和培训场景，帮助学习者理解语音识别技术的评估指标和方法。

数据与资源

语音识别WER结果数据集.zipZIP
0.66 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.66 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

语音识别WER结果数据集

数据与资源

附加信息

注册成功！