自动语音识别书籍数据集-2021-garretttanzer

自动语音识别书籍数据集-2021-garretttanzer 数据来源:互联网公开数据 标签:语音识别,自动语音识别,ASROB,文本转语音,语音数据集,教育,科研,补充材料,工具

数据概述: 本数据集包含来自一本书的自动语音识别(ASR)数据,适用于语音识别和相关技术的研究。数据集分为两部分:CSV文件和JSON文件。CSV文件(asrob.csv)列出了录音的标识符、录音的URL以及记录的类型(训练集、独立说话者测试集或依赖说话者测试集)。JSON文件(asrob.json)包含了每个录音的详细信息,包括句子标识符、语义注释、转录文本以及英文翻译。

数据用途概述: 该数据集适用于语音识别模型的训练、验证和测试,以及语音技术研究和教育。研究人员可以使用此数据集来开发和评估自动语音识别系统,教育工作者可以利用数据集进行语音识别课程的教学。由于数据集包含多语言和多类型的语音样本,它还适用于跨语言语音识别研究和自然语言处理领域的相关应用。此外,数据集中的代码和工具将帮助用户更高效地处理和分析语音数据。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.77 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。