微信短视频推荐用户行为数据集WeChatShortVideoRecommendationUserBehaviorDataset-chengxinhu
数据来源:互联网公开数据
标签:推荐系统, 用户行为分析, 短视频, 机器学习, 点击率预测, 社交媒体, 数据挖掘, 行为预测
数据概述:
该数据集包含来自微信平台短视频推荐场景的用户行为数据,记录了用户与短视频内容的交互情况。主要特征如下:
时间跨度:数据未明确标明具体时间,但根据数据字段推测为一段时间内的用户行为记录。
地理范围:数据来源于微信平台,覆盖范围主要为中国大陆及其他微信用户活跃地区。
数据维度:数据集包含多个CSV文件,涵盖了用户、视频、以及用户对视频的交互信息。关键数据项包括:
userid: 用户ID
feedid: 视频ID
device: 用户使用的设备类型
read_comment: 是否阅读评论
comment: 评论行为
like: 点赞行为
play: 播放行为
stay: 停留时长
click_avatar: 点击头像行为
forward: 转发行为
follow: 关注行为
favorite: 收藏行为
feed_embedding: 视频的embedding向量
authorid: 作者ID
videoplayseconds: 视频播放时长
description: 视频描述
ocr: 光学字符识别结果
asr: 语音识别结果
bgm_song_id: 背景音乐歌曲ID
bgm_singer_id: 背景音乐歌手ID
manual_keyword_list: 人工标注关键词列表
machine_keyword_list: 机器标注关键词列表
manual_tag_list: 人工标注标签列表
machine_tag_list: 机器标注标签列表
description_char: 视频描述的字符数
ocr_char: OCR结果的字符数
asr_char: ASR结果的字符数
数据格式:数据以CSV格式提供,包含多个文件,如test_a.csv、user_action.csv、feed_embeddings.csv、feed_info.csv、submit_demo_a.csv等,方便数据分析和模型构建。
来源信息:数据来源于微信短视频推荐算法相关的公开竞赛或研究项目,已进行匿名化处理。
该数据集适合用于推荐系统、用户行为分析、点击率预测等领域的研究和应用。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于推荐算法、用户行为分析、点击率预测等方面的学术研究,如用户兴趣建模、序列行为预测、冷启动推荐等。
行业应用:为短视频平台、社交媒体、内容推荐服务提供数据支持,尤其在提升推荐精度、优化用户体验、个性化内容分发等方面具有实用价值。
决策支持:支持内容平台的运营策略制定,如用户画像分析、内容创作趋势分析、用户活跃度提升等。
教育和培训:作为推荐系统、数据挖掘、机器学习等课程的实训数据,帮助学生和研究人员深入理解用户行为和推荐算法。
此数据集特别适合用于探索用户在短视频场景下的行为模式,构建个性化推荐模型,提升推荐系统的效果和用户满意度。