YouTube视频人格分析数据集YouTubeVideoPersonalityAnalysisDataset-jules3110
数据来源:互联网公开数据
标签:YouTube, 视频分析, 人格分析, 性别识别, 文本分析, 情感分析, 机器学习, 多模态数据
数据概述:
该数据集包含来自YouTube平台的视频数据,旨在用于研究视频内容与视频发布者人格特质之间的关系。主要特征如下:
时间跨度:数据未明确标注时间,可视为静态数据集。
地理范围:数据来源未明确地域限制,理论上涵盖全球范围内的YouTube视频。
数据维度:
YouTube-Personality-gendercsv:包含视频ID(vlogId)和视频发布者的性别(gender)信息。
YouTube-Personality-audiovisual_featurescsv:包含视频的视听觉特征,如视频时长、音频响度等。
YouTube-Personality-Personality_impression_scores_traincsv:包含视频发布者人格印象分数,通过人工标注获得。
transcripts:包含多个视频的转录文本,用于文本分析。
数据格式:包括CSV和TXT两种格式,CSV文件包含结构化数据,TXT文件包含视频转录文本。
来源信息:数据来源于YouTube平台,收集并整理了视频ID、视听特征、人格印象分数和视频转录文本。
该数据集适合用于人格分析、情感分析和多模态数据分析研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于心理学、传播学、人工智能等领域的学术研究,如视频内容与人格特质的关系研究、情感分析、跨模态数据分析等。
行业应用:为视频内容创作、社交媒体分析、广告营销等行业提供数据支持,如用户画像构建、内容推荐优化等。
决策支持:支持内容创作者了解用户偏好、优化视频内容,帮助平台进行个性化推荐。
教育和培训:作为数据科学、机器学习、自然语言处理等相关课程的案例研究素材。
此数据集特别适合用于探索视频内容、发布者人格特质和用户反馈之间的关系,帮助用户实现内容优化、个性化推荐等目标。