YouTube游戏和应用中虚拟形象视频转录文本数据集

YouTube游戏和应用中虚拟形象视频转录文本数据集 数据来源:互联网公开数据 标签:YouTube,视频转录,虚拟形象,游戏,应用,自然语言处理,文本分析,情感分析 数据概述: 本数据集包含从YouTube视频中提取的音频转录文本。视频地址通过youtube-data-api-v3收集,音频转录文本同样获取自YouTube。每个视频被分割成250个单词的文本块,平均对应1.5分钟的对话时间。每个文本块由LLaMA 3 70B Instruct模型进行标记评估。 数据用途概述: 该数据集适用于自然语言处理、文本分析、情感分析等多种研究场景。研究人员可以利用此数据进行情感分析,了解用户对游戏和应用中虚拟形象的看法;可以进行文本摘要、主题建模等研究,以提取视频内容的关键信息;此外,该数据集也适用于机器翻译、语音识别等领域。

数据集描述: 评估文本块的情感,使用情绪PAD模型。 提供每个维度的系数,范围从-10到10: 愉悦度(Pleasure):-10(最大不愉悦)到10(最大愉悦) 唤醒度(Arousal):-10(最大不唤醒)到10(最大唤醒) 支配度(Dominance):-10(最大服从)到10(最大支配) 文本:{文本块}

数据与资源

附加信息

字段
版本 1.0
最后更新 六月 1, 2025, 18:02 (UTC)
创建于 六月 1, 2025, 18:01 (UTC)