找到546个数据集

标签: 语音处理

过滤结果
  • 性别语音识别数据集GenderVoiceRecognitionDataset-iamkhnjan18

    2025年4月22日   

    性别语音识别数据集GenderVoiceRecognitionDataset-iamkhnjan18 数据来源:互联网公开数据 标签:语音识别,性别分类,数据集,机器学习,人工智能,音频处理,声音分析,技术研究 数据概述: 该数据集包含来自公开来源的语音数据,记录了不同性别个体的声音特征。主要特征如下:...
    packageimg
  • 情感语音合成数据集EmoSpeechV2-alherra26

    2025年4月22日   

    情感语音合成数据集EmoSpeechV2-alherra26 数据来源:互联网公开数据 标签:语音合成,情感识别,数据集,自然语言处理,深度学习,语音情感,音频处理,人工智能 数据概述:该数据集包含来自 EmoSpeech 项目的第二版情感语音合成数据,记录了不同情感状态下的语音数据。主要特征如下: 时间跨度:数据记录的时间范围为数据集发布时间。...
    packageimg
  • 鸟类声音特征提取数据集-2022-yukanas

    2025年4月22日   

    鸟类声音特征提取数据集-2022-yukanas 数据来源:互联网公开数据 标签:鸟类声音,特征提取,MFCC,音频处理,声音分类,机器学习,数据集 数据概述: 本数据集包含从BirdCLEF...
    packageimg
  • 音频特征增强与梅尔频率倒谱系数数据集DFwithAugmentedMFCC40Dataset-jabedcse

    2025年4月22日   

    音频特征增强与梅尔频率倒谱系数数据集DFwithAugmentedMFCC40Dataset-jabedcse 数据来源:互联网公开数据 标签:音频处理,梅尔频率倒谱系数,数据增强,数据集,机器学习,语音识别,信号处理,声学分析 数据概述: 该数据集包含经过增强处理的音频数据及其对应的梅尔频率倒谱系数(MFCC)特征。主要特征如下:...
    packageimg
  • 自动语音识别书籍数据集-2021-garretttanzer

    2025年4月22日   

    自动语音识别书籍数据集-2021-garretttanzer 数据来源:互联网公开数据 标签:语音识别,自动语音识别,ASROB,文本转语音,语音数据集,教育,科研,补充材料,工具 数据概述:...
    packageimg
  • 姓名发音性别预测数据集-amritvirsinghx

    2025年4月22日   

    姓名发音性别预测数据集-amritvirsinghx 数据来源:互联网公开数据 标签:姓名,发音,性别预测,自然语言处理,机器学习,语音识别,数据挖掘,语言学 数据概述: 本数据集包含超过1000个姓名及其对应的性别信息,旨在为基于发音的性别预测研究提供数据支持。数据内容涵盖了不同文化背景下的姓名,为模型训练提供了多样化的样本。 数据用途概述:...
    packageimg
  • 俄罗斯单词重音预测数据集-williamsutcliffe

    2025年4月22日   

    俄罗斯单词重音预测数据集-williamsutcliffe 数据来源:互联网公开数据 标签:俄罗斯,重音,语言学,深度学习,RNN,Transformer,字符标记化,语音学 数据概述:...
    packageimg
  • 柬埔寨公共工程与运输部MPWT高棉语语音数据集-sovanndaradiep

    2025年4月22日   

    柬埔寨公共工程与运输部MPWT高棉语语音数据集-sovanndaradiep 数据来源:互联网公开数据 标签:语音识别,高棉语,数据集,语音信号处理,自然语言处理,声学模型,语音合成,语言学 数据概述: 该数据集包含来自柬埔寨公共工程与运输部(MPWT)的高棉语语音数据,旨在用于语音识别,语音合成等研究。主要特征如下:...
    packageimg
  • 音频与图像联合数据集Audio-ImageJointDataset-segnidessalegn

    2025年4月22日   

    音频与图像联合数据集Audio-ImageJointDataset-segnidessalegn 数据来源:互联网公开数据 标签:多媒体,数据集,音频处理,图像分析,深度学习,计算机视觉,模式识别,数据融合 数据概述: 该数据集包含与音频和图像相关联的多媒体数据,记录了音频信号与对应图像的特征信息。主要特征如下:...
    packageimg
  • 神经网络训练数据集NNDataset-rhs342001

    2025年4月22日   

    神经网络训练数据集NNDataset-rhs342001 数据来源:互联网公开数据 标签:神经网络,数据集,机器学习,图像识别,深度学习,计算机视觉,自然语言处理,模型训练 数据概述: 该数据集包含用于训练和评估神经网络模型的数据,涵盖多种类型的数据,包括图像,文本,音频等。主要特征如下:...
    packageimg
  • 语音性别识别与音频特征分析数据集MFCC特征-性别与年龄-多语种-20000人-baakkzlay

    2025年4月22日   

    语音性别识别与音频特征分析数据集MFCC特征-性别与年龄-多语种-20000人-baakkzlay 数据来源:互联网公开数据 标签:语音识别,性别识别,MFCC,音频特征,机器学习,声学,语音数据,年龄,性别,教育 数据概述:...
    packageimg
  • 音频增强训练数据集AugmentedTrainShortAudioNoCallFold0to4Dataset-huyhoang333

    2025年4月22日   

    音频增强训练数据集AugmentedTrainShortAudioNoCallFold0to4Dataset-huyhoang333 数据来源:互联网公开数据 标签:音频处理,数据增强,机器学习,语音识别,信号处理,数据集,深度学习,人工智能 数据概述: 该数据集包含经过音频增强处理的短音频片段,主要用于训练和测试机器学习模型。主要特征如下:...
    packageimg
  • 信号过滤到序列到序列模型数据集-arvaloplz

    2025年4月22日   

    信号过滤到序列到序列模型数据集-arvaloplz 数据来源:互联网公开数据 标签:信号处理,序列到序列模型,机器学习,数据分析,时间序列,语音识别,自然语言处理,深度学习 数据概述: 该数据集包含了用于训练和评估信号过滤到序列到序列(seq2seq)模型的数据。主要记录了原始信号及其对应的经过过滤后的信号,旨在用于学习信号处理和转换。主要特征如下:...
    packageimg
  • 数据2022年鸟类识别挑战赛BirdCLEF2022扩展元数据集-tatamikenn

    2025年4月22日   

    2022年鸟类识别挑战赛BirdCLEF2022扩展元数据集-tatamikenn 数据来源:互联网公开数据 标签:鸟类识别,数据集,机器学习,音频元数据,Kaggle,生态学,物种识别,声音分析,扩展元数据 数据概述: 本数据集包含2022年Kaggle鸟类识别挑战赛(BirdCLEF...
    packageimg
  • 语音情感识别中的MFCC特征数据集-2011至2021年-cracc97

    2025年4月22日   

    语音情感识别中的MFCC特征数据集-2011至2021年-cracc97 数据来源:互联网公开数据 标签:MFCCs,语音情感识别,情感预测,音频分析,性别区分,机器学习,数据集 数据概述:...
    packageimg
  • 数据2020年鸟类声音识别验证音频与标注数据集

    2025年4月22日   

    数据2020年鸟类声音识别验证音频与标注数据集 数据来源:互联网公开数据 标签:鸟类识别,音频数据,验证集,生态研究,机器学习,生物声学 数据概述:...
    packageimg
  • 雄性斑胸finch鸣叫声标注音频数据集-伊朗基础科学研究院IPM-tahouramorovati

    2025年4月22日   

    雄性斑胸finch鸣叫声标注音频数据集-伊朗基础科学研究院IPM-tahouramorovati 数据来源:互联网公开数据 标签:斑胸鸣叫,音频数据,雄性,标注,IPM,伊朗,基础科学研究院,音频项目 数据概述: 本数据集包含了雄性斑胸(zephraena guttata)的鸣叫声标注音频文件,数据来源于伊朗基础科学研究院(Institute For...
    packageimg
  • 乌克兰语音到文本数据集

    2025年4月22日   

    乌克兰语音到文本数据集 数据来源:互联网公开数据 标签:乌克兰,语音到文本,语音识别,自然语言处理,机器学习,音频数据,文本转写 数据概述:...
    packageimg
  • 多维度声音数据集助力声音分析与分类

    2025年4月22日   

    标题:多维度声音数据集助力声音分析与分类 数据内容: 本数据集包含了丰富的声音相关数据元素,具体包括: 1. 文件名(fname):标识声音文件的唯一名称。 2. 类别(label):声音的主分类标签,共有4种不同值。 3. 子类别(sublabel):声音的细分分类标签,共有3种不同值。 4. 周期(cycle):声音的周期特性,共有19种不同值。...
    packageimg
  • YouTube音频说话人识别特征数据集-不同场景-64维-analystanand

    2025年4月22日   

    YouTube音频说话人识别特征数据集-不同场景-64维-analystanand 数据来源:互联网公开数据 标签:音频,说话人识别,YouTube,特征提取,机器学习,语音识别,音频分析,pyAudioAnalysis 数据概述:...
    packageimg