微信短视频推荐算法用户行为数据集WeChatShortVideoRecommendationAlgorithmUserBehaviorDataset-pinkpinkpig
数据来源:互联网公开数据
标签:短视频推荐, 用户行为分析, 机器学习, 推荐系统, 社交媒体, 数据挖掘, 行为预测, 算法优化
数据概述:
该数据集包含来自微信平台短视频推荐场景的用户行为数据和视频内容信息,用于支持推荐算法的研究与开发。主要特征如下:
时间跨度:数据未明确标注具体时间,但包含日期字段,可推测为一段时间内的用户行为记录。
地理范围:数据来源于微信平台,主要面向中国大陆地区用户。
数据维度:数据集包括用户行为数据(如阅读评论、点赞、播放、停留时长、点击头像、转发、关注、收藏等)、视频内容信息(如视频ID、作者ID、播放时长、描述、OCR文本、ASR文本、背景音乐信息、关键词和标签等)以及用户和视频的交互信息。
数据格式:数据以CSV格式存储,包含多个CSV文件,如test_a.csv(测试集)、user_action.csv(用户行为)、feed_embeddings.csv(视频内容向量)、submit_demo_σê¥Φ╡¢a.csv(提交示例)、feed_info.csv(视频信息)。
来源信息:数据来源于微信算法比赛,已进行脱敏处理。
该数据集适合用于推荐算法研究、用户行为分析、特征工程和模型训练。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于推荐算法、用户行为建模、内容理解等领域的学术研究,如用户兴趣建模、点击率预估等。
行业应用:可以为短视频平台、内容推荐系统提供数据支持,尤其在个性化推荐、内容排序、用户画像等方面具有实用价值。
决策支持:支持平台优化内容策略、提升用户体验,例如通过分析用户行为数据,调整推荐策略,提高用户粘性。
教育和培训:作为推荐系统、机器学习等课程的实训素材,帮助学生和研究人员深入理解推荐算法的工作原理。
此数据集特别适合用于探索用户与短视频内容的交互模式,优化推荐算法的性能,提升用户满意度。