个性化电影推荐广告活动数据集

个性化电影推荐广告活动数据集

数据来源:互联网公开数据

标签:电影推荐,用户行为,广告营销,个性化推荐,数据挖掘,协同过滤,内容推荐,案例研究

数据概述
本数据集旨在构建和评估电影推荐系统,包含详细的电影信息、用户评分以及用户互动数据。数据集涵盖了电影的基本属性(如类型、发行年份、评分等)、用户对电影的评分记录以及用户的历史观影行为。数据来源于Danny Ma的“Serious SQL在线学徒计划”中的“营销分析案例研究”部分,经过整理和清洗,适合作为构建推荐系统和开展数据分析的基础素材。

数据用途概述
该数据集适用于多种数据分析和推荐系统任务,包括但不限于:
1. 协同过滤推荐:利用用户评分和观影历史,为用户推荐与其兴趣匹配的电影。
2. 内容推荐:基于电影的属性(如类型、导演、演员等),为用户推荐相似的电影。
3. 混合推荐系统:结合用户行为和电影内容信息,实现更为精准的个性化推荐。
4. 营销分析:通过分析用户观影偏好,为广告和营销活动提供数据支持,例如定制化推荐邮件和个性化广告内容。
5. 用户行为分析:深入研究用户的观影习惯,评估不同类型的电影对用户吸引力的差异。
6. 教育和研究:适合用于推荐系统开发、数据挖掘课程的教学或研究项目,帮助学习者理解推荐算法的实现和优化过程。

数据集关键要素
1. 电影信息表
- 字段定义:
- movie_id:电影唯一标识符。
- title:电影标题。
- release_year:电影发行年份。
- genres:电影类型(如动作、喜剧、科幻等)。
- director:导演姓名。
- actors:主要演员列表。
- rating:电影平均评分(用户评分的平均值)。
- votes:用户评分数量。

  1. 用户评分表
  2. 字段定义:
  3. user_id:用户唯一标识符。
  4. movie_id:用户评分的电影标识符。
  5. rating:用户对该电影的评分(1-5分)。
  6. timestamp:评分记录的时间戳。

  7. 用户观影记录表

  8. 字段定义:
  9. user_id:用户唯一标识符。
  10. movie_id:用户观看的电影标识符。
  11. timestamp:观影记录的时间戳。

  12. 用户信息表(可选)

  13. 字段定义:
  14. user_id:用户唯一标识符。
  15. age:用户年龄(脱敏处理,非敏感信息)。
  16. gender:用户性别(脱敏处理,非敏感信息)。
  17. location:用户所在地区(脱敏处理,非敏感信息)。

示例需求说明
需求 1:用户偏好分类
- 目标:为每个用户识别其过去观影历史中排名前2的电影类型。
- 应用场景:这些类型将用于驱动营销创意,例如为特定类型的电影设计个性化广告图片。

需求 2:类别电影推荐
- 目标:为用户偏好分类中的前2个类别,推荐3部最受欢迎的电影(用户未观看过的)。
- 限制条件:如果符合条件的电影少于3部,则至少推荐1部。

需求 3 和 4:用户行为洞察
- 目标:为每个用户在前2个偏好类别中分析其观影行为,包括:
- 总观影数量。
- 与平均用户相比的观影数量差异。
- 在该类别中的排名百分比(如位于前X%)。

数据集价值
该数据集为构建电影推荐系统提供了丰富的基础数据支持,同时结合了营销应用场景,能够帮助研究人员、数据分析师和推荐系统开发者:
1. 实现精准的个性化推荐,提升用户体验和满意度。
2. 优化广告和营销活动,提高用户参与度和转化率。
3. 深入理解用户行为,为产品优化和决策提供数据依据。

其他信息
- 数据来源说明:数据集来源于公开的在线学徒计划项目,经过整理和清洗,确保数据质量和可用性。
- 数据规模:包含数千部电影和数万条用户评分记录,覆盖多种类型和时间跨度。
- 数据格式:数据以CSV文件格式提供,易于导入和分析。

数据集获取
如需获取完整数据集及项目详细信息,请访问项目GitHub仓库:
https://github.com/itsmeyogesh22/Marketing-Analytics-Case-Study.git

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 08:25 (UTC)
创建于 四月 14, 2025, 08:25 (UTC)