找到2个数据集

标签: 多语言语音数据

过滤结果
  • Benchmark_Database_语音对齐手动编辑基准数据

    2026年2月8日 30 184 128

    数据集概述 本数据集为语音对齐基准数据库,包含十五个压缩文件,涵盖斯拉夫语、法语、罗曼语等多种语言的手动编辑语音对齐数据,旨在为历史语言学和方言学领域的自动对齐算法提供测试与性能优化的基准平台,覆盖语音对齐分析中的典型问题。 文件详解 压缩文件组(archive_files)...
    packageimg
  • Common_Voice_11_0_Spoken_NER_Dataset

    2026年1月22日 30 122 99

    数据集概述 本数据集是基于Common Voice 11.0构建的口语命名实体识别(Spoken NER)数据集,包含荷兰语、英语和德语三种语言的口语命名实体识别数据,共3个JSON格式文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集。 文件详解 荷兰语口语命名实体识别数据文件 文件名称:cv_nl_dataset.json...
    packageimg