LibriCount10_0dB_说话人数量估计数据集

数据集概述

该数据集为说话人数量估计任务提供合成数据,基于LibriSpeech CleanTest数据集构建,包含0至10个说话人同时发声的5秒音频,混合信噪比为0分贝,每个录音文件名含真实说话人数,配套JSON标注文件记录说话人性别、ID及语音活动信息。

文件详解

  • 文件名称:LibriCount10-0dB.zip
  • 文件格式:ZIP压缩包
  • 包含内容:
  • 音频文件:16位、16kHz单声道WAV格式,时长5秒,文件名格式为k_uniquefile.wav(k为录音中最大并发说话人数)
  • 标注文件:与音频同名的JSON文件,字段包括:
  • sex:说话人性别(F/M)
  • activity:语音活动时间区间(采样点单位)
  • speaker_id:说话人唯一标识ID

适用场景

  • 说话人数量估计算法的训练与测试
  • 鸡尾酒会场景语音分离技术研究
  • 语音活动检测(VAD)系统性能验证
  • 多说话人音频处理模型的开发与优化
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 793.93 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。