数据集

YouTube游戏和应用中虚拟形象视频转录文本数据集

YouTube游戏和应用中虚拟形象视频转录文本数据集数据来源：互联网公开数据标签：YouTube,视频转录,虚拟形象,游戏,应用,自然语言处理,文本分析,情感分析数据概述：本数据集包含从YouTube视频中提取的音频转录文本。视频地址通过youtube-data-api-v3收集，音频转录文本同样获取自YouTube。每个视频被分割成250个单词的文本块，平均对应1.5分钟的对话时间。每个文本块由LLaMA 3 70B Instruct模型进行标记评估。数据用途概述：该数据集适用于自然语言处理、文本分析、情感分析等多种研究场景。研究人员可以利用此数据进行情感分析，了解用户对游戏和应用中虚拟形象的看法；可以进行文本摘要、主题建模等研究，以提取视频内容的关键信息；此外，该数据集也适用于机器翻译、语音识别等领域。

数据集描述：评估文本块的情感，使用情绪PAD模型。提供每个维度的系数，范围从-10到10：愉悦度（Pleasure）：-10（最大不愉悦）到10（最大愉悦）唤醒度（Arousal）：-10（最大不唤醒）到10（最大唤醒）支配度（Dominance）：-10（最大服从）到10（最大支配）文本：{文本块}

数据与资源

YouTube游戏和应用中虚拟形象视频转录文本数据集.zipZIP
214.42 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	214.42 MiB
最后更新	2025年6月1日
创建于	2025年6月1日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。