个性化电影推荐广告活动数据集
数据来源:互联网公开数据
标签:电影推荐,用户行为,广告营销,个性化推荐,数据挖掘,协同过滤,内容推荐,案例研究
数据概述
本数据集旨在构建和评估电影推荐系统,包含详细的电影信息、用户评分以及用户互动数据。数据集涵盖了电影的基本属性(如类型、发行年份、评分等)、用户对电影的评分记录以及用户的历史观影行为。数据来源于Danny Ma的“Serious SQL在线学徒计划”中的“营销分析案例研究”部分,经过整理和清洗,适合作为构建推荐系统和开展数据分析的基础素材。
数据用途概述
该数据集适用于多种数据分析和推荐系统任务,包括但不限于:
1. 协同过滤推荐:利用用户评分和观影历史,为用户推荐与其兴趣匹配的电影。
2. 内容推荐:基于电影的属性(如类型、导演、演员等),为用户推荐相似的电影。
3. 混合推荐系统:结合用户行为和电影内容信息,实现更为精准的个性化推荐。
4. 营销分析:通过分析用户观影偏好,为广告和营销活动提供数据支持,例如定制化推荐邮件和个性化广告内容。
5. 用户行为分析:深入研究用户的观影习惯,评估不同类型的电影对用户吸引力的差异。
6. 教育和研究:适合用于推荐系统开发、数据挖掘课程的教学或研究项目,帮助学习者理解推荐算法的实现和优化过程。
数据集关键要素
1. 电影信息表
- 字段定义:
- movie_id
:电影唯一标识符。
- title
:电影标题。
- release_year
:电影发行年份。
- genres
:电影类型(如动作、喜剧、科幻等)。
- director
:导演姓名。
- actors
:主要演员列表。
- rating
:电影平均评分(用户评分的平均值)。
- votes
:用户评分数量。
- 用户评分表
- 字段定义:
user_id
:用户唯一标识符。
movie_id
:用户评分的电影标识符。
rating
:用户对该电影的评分(1-5分)。
-
timestamp
:评分记录的时间戳。
-
用户观影记录表
- 字段定义:
user_id
:用户唯一标识符。
movie_id
:用户观看的电影标识符。
-
timestamp
:观影记录的时间戳。
-
用户信息表(可选)
- 字段定义:
user_id
:用户唯一标识符。
age
:用户年龄(脱敏处理,非敏感信息)。
gender
:用户性别(脱敏处理,非敏感信息)。
location
:用户所在地区(脱敏处理,非敏感信息)。
示例需求说明
需求 1:用户偏好分类
- 目标:为每个用户识别其过去观影历史中排名前2的电影类型。
- 应用场景:这些类型将用于驱动营销创意,例如为特定类型的电影设计个性化广告图片。
需求 2:类别电影推荐
- 目标:为用户偏好分类中的前2个类别,推荐3部最受欢迎的电影(用户未观看过的)。
- 限制条件:如果符合条件的电影少于3部,则至少推荐1部。
需求 3 和 4:用户行为洞察
- 目标:为每个用户在前2个偏好类别中分析其观影行为,包括:
- 总观影数量。
- 与平均用户相比的观影数量差异。
- 在该类别中的排名百分比(如位于前X%)。
数据集价值
该数据集为构建电影推荐系统提供了丰富的基础数据支持,同时结合了营销应用场景,能够帮助研究人员、数据分析师和推荐系统开发者:
1. 实现精准的个性化推荐,提升用户体验和满意度。
2. 优化广告和营销活动,提高用户参与度和转化率。
3. 深入理解用户行为,为产品优化和决策提供数据依据。
其他信息
- 数据来源说明:数据集来源于公开的在线学徒计划项目,经过整理和清洗,确保数据质量和可用性。
- 数据规模:包含数千部电影和数万条用户评分记录,覆盖多种类型和时间跨度。
- 数据格式:数据以CSV文件格式提供,易于导入和分析。
数据集获取
如需获取完整数据集及项目详细信息,请访问项目GitHub仓库:
https://github.com/itsmeyogesh22/Marketing-Analytics-Case-Study.git