AUGUSTA语音转文本语言模型训练数据集

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

AUGUSTA语音转文本语言模型训练数据集

数据集概述

该数据集包含用于微调AUGUSTA语音转文本模型的元数据和精选数据集，AUGUSTA是基于OpenAI Whisper定制的模型，可将南蒂罗尔方言语音转录为标准德语。

文件详解

文件名称: augusta_data-main.zip
文件格式: ZIP压缩包
文件内容: 包含用于微调AUGUSTA语音转文本模型的元数据和精选数据集，具体字段及内容需解压后查看

适用场景

语音转文本模型训练: 用于训练或微调针对南蒂罗尔方言与标准德语转换的语音识别模型
方言语音处理研究: 支持南蒂罗尔方言语音特征提取、转录规则分析等研究
多语言语音模型优化: 为跨方言语音转文本模型的鲁棒性提升提供训练数据
语音数据资源建设: 作为南蒂罗尔方言语音数据的补充资源，支持相关语音语料库构建

数据与资源

16688011.zipZIP
27.45 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	27.45 MiB
最后更新	2025年12月22日
创建于	2025年12月22日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？