多模态情感分析视频数据集

多模态情感分析视频数据集_Multimodal_Emotion_Analysis_Video_Dataset

数据来源:互联网公开数据

标签:情感分析, 多模态, 视频分析, 语音识别, 计算机视觉, 文本分析, 情感识别, 机器学习

数据概述: 该数据集包含来自视频评论的多模态数据,记录了用户对不同主题视频的评论内容,并结合了音频、视频和文本信息,用于情感分析研究。主要特征如下: 时间跨度:数据未明确标注时间戳,可视为静态数据集。 地理范围:数据来源未明确标注地域信息,但内容涉及多种语言,如西班牙语等。 数据维度:数据集包含音频文件(.wav),视频文件(.mp4),文本转录(.trs, .csv),以及多模态特征(音频特征,视觉特征)。数据包括: 音频特征:如 pcm_intensity, pcm_loudness, MFCCs, LSP频率, pcm_zcr, voiceProb, F0, F0env, pcm_RMSenergy等。 视频转录:包括起始时间、结束时间、语音内容(Speech/transcription)和情感标注(sentimentAnnotations)。 数据格式:数据以多种格式提供,包括音频的.wav格式,视频的.mp4格式,文本转录的.trs和.csv格式,以及csv格式的多模态特征文件,便于多模态数据融合分析。 来源信息:数据来源于公开的视频评论,并经过了转录和特征提取处理。 该数据集适合用于多模态情感分析、语音识别、计算机视觉和自然语言处理等领域的研究。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于情感分析、多模态学习、语音识别、视频理解等方向的学术研究,如跨模态情感预测、情感识别模型构建等。 行业应用:可以为内容推荐、广告分析、用户行为分析等行业提供数据支持,特别是在理解用户对视频内容的真实情感反馈方面。 决策支持:支持产品评价、市场调查和用户体验研究,帮助企业了解用户情感并优化产品和服务。 教育和培训:作为多模态情感分析、机器学习、深度学习等课程的实训材料,帮助学生和研究人员深入理解多模态数据处理和情感识别技术。 此数据集特别适合用于探索不同模态信息(音频、视频、文本)之间的关联性,并构建更准确的情感预测模型,从而帮助用户提升对情感分析和理解能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 499.38 MiB
最后更新 2025年10月11日
创建于 2025年10月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。