言语流畅度评估语音数据集SpeechFluencyEvaluationDataset-mitulgargsam
数据来源:互联网公开数据
标签:语音识别, 言语流畅度, 口吃, 语音分析, 医学研究, 语言学, 文本标注, 声音特征
数据概述:
该数据集包含来自FluencyBank项目的数据,记录了关于言语流畅度评估的语音数据。主要特征如下:
时间跨度:数据未明确标注时间,可视为静态语音样本。
地理范围:数据来源未明确,但FluencyBank项目通常涵盖多种语言和文化背景下的语音数据。
数据维度:数据集包含多个字段,主要包括:Und(不确定)、Show(节目名称)、EpId(剧集ID)、ClipId(片段ID)、Start(起始时间)、Stop(结束时间)、Unsure(不确定)、PoorAudioQuality(音频质量差)、Prolongation(延长)、Block(阻滞)、SoundRep(语音重复)、WordRep(单词重复)、DifficultToUnderstand(难以理解)、Interjection(插入语)、NoStutteredWords(无口吃词)、NaturalPause(自然停顿)、Music(音乐)、NoSpeech(无语音)以及一系列数值,可能代表语音特征或标注结果。
数据格式:CSV格式,文件名为fluencybank_stuttering.csv,便于数据分析和处理。
来源信息:数据来源于FluencyBank项目,该项目致力于收集和分析言语障碍相关的数据。该数据集适用于语音处理、言语流畅度分析等研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于言语病理学、语音识别、计算语言学等领域的学术研究,例如口吃诊断、言语障碍分析、语音特征提取等。
行业应用:为语音技术公司、医疗机构、语言治疗师提供数据支持,尤其是在开发语音评估工具、辅助言语治疗方面。
决策支持:支持言语治疗方案的制定和评估,以及相关疾病的早期诊断。
教育和培训:作为语言学、语音学、言语病理学等专业课程的辅助材料,帮助学生和研究人员深入理解言语流畅度相关内容。
此数据集特别适合用于探索口吃等言语障碍的语音特征,并为相关技术的开发提供数据支持。