LibriCount10_0dB_说话人数量估计数据集

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

LibriCount10_0dB_说话人数量估计数据集

数据集概述

该数据集为说话人数量估计任务提供合成数据，基于LibriSpeech CleanTest数据集构建，包含0至10个说话人同时发声的5秒音频，混合信噪比为0分贝，每个录音文件名含真实说话人数，配套JSON标注文件记录说话人性别、ID及语音活动信息。

文件详解

文件名称：LibriCount10-0dB.zip
文件格式：ZIP压缩包
包含内容：
音频文件：16位、16kHz单声道WAV格式，时长5秒，文件名格式为k_uniquefile.wav（k为录音中最大并发说话人数）
标注文件：与音频同名的JSON文件，字段包括：
sex：说话人性别（F/M）
activity：语音活动时间区间（采样点单位）
speaker_id：说话人唯一标识ID

适用场景

说话人数量估计算法的训练与测试
鸡尾酒会场景语音分离技术研究
语音活动检测（VAD）系统性能验证
多说话人音频处理模型的开发与优化

数据与资源

1216072.zipZIP
793.93 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	793.93 MiB
最后更新	2025年12月16日
创建于	2025年12月16日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？