微信短视频推荐用户行为数据集WeChatShortVideoRecommendationUserBehaviorDataset-chengxinhu

微信短视频推荐用户行为数据集WeChatShortVideoRecommendationUserBehaviorDataset-chengxinhu

数据来源:互联网公开数据

标签:推荐系统, 用户行为分析, 短视频, 机器学习, 点击率预测, 社交媒体, 数据挖掘, 行为预测

数据概述: 该数据集包含来自微信平台短视频推荐场景的用户行为数据,记录了用户与短视频内容的交互情况。主要特征如下: 时间跨度:数据未明确标明具体时间,但根据数据字段推测为一段时间内的用户行为记录。 地理范围:数据来源于微信平台,覆盖范围主要为中国大陆及其他微信用户活跃地区。 数据维度:数据集包含多个CSV文件,涵盖了用户、视频、以及用户对视频的交互信息。关键数据项包括: userid: 用户ID feedid: 视频ID device: 用户使用的设备类型 read_comment: 是否阅读评论 comment: 评论行为 like: 点赞行为 play: 播放行为 stay: 停留时长 click_avatar: 点击头像行为 forward: 转发行为 follow: 关注行为 favorite: 收藏行为 feed_embedding: 视频的embedding向量 authorid: 作者ID videoplayseconds: 视频播放时长 description: 视频描述 ocr: 光学字符识别结果 asr: 语音识别结果 bgm_song_id: 背景音乐歌曲ID bgm_singer_id: 背景音乐歌手ID manual_keyword_list: 人工标注关键词列表 machine_keyword_list: 机器标注关键词列表 manual_tag_list: 人工标注标签列表 machine_tag_list: 机器标注标签列表 description_char: 视频描述的字符数 ocr_char: OCR结果的字符数 asr_char: ASR结果的字符数 数据格式:数据以CSV格式提供,包含多个文件,如test_a.csv、user_action.csv、feed_embeddings.csv、feed_info.csv、submit_demo_a.csv等,方便数据分析和模型构建。 来源信息:数据来源于微信短视频推荐算法相关的公开竞赛或研究项目,已进行匿名化处理。 该数据集适合用于推荐系统、用户行为分析、点击率预测等领域的研究和应用。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于推荐算法、用户行为分析、点击率预测等方面的学术研究,如用户兴趣建模、序列行为预测、冷启动推荐等。 行业应用:为短视频平台、社交媒体、内容推荐服务提供数据支持,尤其在提升推荐精度、优化用户体验、个性化内容分发等方面具有实用价值。 决策支持:支持内容平台的运营策略制定,如用户画像分析、内容创作趋势分析、用户活跃度提升等。 教育和培训:作为推荐系统、数据挖掘、机器学习等课程的实训数据,帮助学生和研究人员深入理解用户行为和推荐算法。 此数据集特别适合用于探索用户在短视频场景下的行为模式,构建个性化推荐模型,提升推荐系统的效果和用户满意度。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 386.7 MiB
最后更新 2025年5月28日
创建于 2025年5月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。