数据集

个性化电影推荐广告活动数据集

数据来源：互联网公开数据

标签：电影推荐，用户行为，广告营销，个性化推荐，数据挖掘，协同过滤，内容推荐，案例研究

数据概述
本数据集旨在构建和评估电影推荐系统，包含详细的电影信息、用户评分以及用户互动数据。数据集涵盖了电影的基本属性（如类型、发行年份、评分等）、用户对电影的评分记录以及用户的历史观影行为。数据来源于Danny Ma的“Serious SQL在线学徒计划”中的“营销分析案例研究”部分，经过整理和清洗，适合作为构建推荐系统和开展数据分析的基础素材。

数据用途概述
该数据集适用于多种数据分析和推荐系统任务，包括但不限于：
1. 协同过滤推荐：利用用户评分和观影历史，为用户推荐与其兴趣匹配的电影。
2. 内容推荐：基于电影的属性（如类型、导演、演员等），为用户推荐相似的电影。
3. 混合推荐系统：结合用户行为和电影内容信息，实现更为精准的个性化推荐。
4. 营销分析：通过分析用户观影偏好，为广告和营销活动提供数据支持，例如定制化推荐邮件和个性化广告内容。
5. 用户行为分析：深入研究用户的观影习惯，评估不同类型的电影对用户吸引力的差异。
6. 教育和研究：适合用于推荐系统开发、数据挖掘课程的教学或研究项目，帮助学习者理解推荐算法的实现和优化过程。

数据集关键要素
1. 电影信息表
- 字段定义：
- movie_id：电影唯一标识符。
- title：电影标题。
- release_year：电影发行年份。
- genres：电影类型（如动作、喜剧、科幻等）。
- director：导演姓名。
- actors：主要演员列表。
- rating：电影平均评分（用户评分的平均值）。
- votes：用户评分数量。

用户评分表
字段定义：
user_id：用户唯一标识符。
movie_id：用户评分的电影标识符。
rating：用户对该电影的评分（1-5分）。
timestamp：评分记录的时间戳。
用户观影记录表
字段定义：
user_id：用户唯一标识符。
movie_id：用户观看的电影标识符。
timestamp：观影记录的时间戳。
用户信息表（可选）
字段定义：
user_id：用户唯一标识符。
age：用户年龄（脱敏处理，非敏感信息）。
gender：用户性别（脱敏处理，非敏感信息）。
location：用户所在地区（脱敏处理，非敏感信息）。

示例需求说明
需求 1：用户偏好分类
- 目标：为每个用户识别其过去观影历史中排名前2的电影类型。
- 应用场景：这些类型将用于驱动营销创意，例如为特定类型的电影设计个性化广告图片。

需求 2：类别电影推荐
- 目标：为用户偏好分类中的前2个类别，推荐3部最受欢迎的电影（用户未观看过的）。
- 限制条件：如果符合条件的电影少于3部，则至少推荐1部。

需求 3 和 4：用户行为洞察
- 目标：为每个用户在前2个偏好类别中分析其观影行为，包括：
- 总观影数量。
- 与平均用户相比的观影数量差异。
- 在该类别中的排名百分比（如位于前X%）。

数据集价值
该数据集为构建电影推荐系统提供了丰富的基础数据支持，同时结合了营销应用场景，能够帮助研究人员、数据分析师和推荐系统开发者：
1. 实现精准的个性化推荐，提升用户体验和满意度。
2. 优化广告和营销活动，提高用户参与度和转化率。
3. 深入理解用户行为，为产品优化和决策提供数据依据。

其他信息
- 数据来源说明：数据集来源于公开的在线学徒计划项目，经过整理和清洗，确保数据质量和可用性。
- 数据规模：包含数千部电影和数万条用户评分记录，覆盖多种类型和时间跨度。
- 数据格式：数据以CSV文件格式提供，易于导入和分析。

数据集获取
如需获取完整数据集及项目详细信息，请访问项目GitHub仓库：
https://github.com/itsmeyogesh22/Marketing-Analytics-Case-Study.git

数据与资源

个性化电影推荐广告活动数据集.zipZIP
0.69 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.69 MiB
最后更新	2025年4月14日
创建于	2025年4月14日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

个性化电影推荐广告活动数据集

数据与资源

附加信息

注册成功！