TMDB电影用户评分与票房综合数据集-2023-aayushsoni4
数据来源:互联网公开数据
标签:电影,TMDB,用户评分,票房,电影数据,推荐系统,数据分析,机器学习,电影评论,影视产业
数据概述:
本数据集整合了截至2023年的TMDB 6000部电影的详细信息,并融合了用户评分数据,旨在提供一个更全面的电影世界探索平台。该数据集融合了TMDB 5000电影数据集,并增加了用户评分,为数据爱好者、研究人员和机器学习从业者提供了宝贵的资源。
数据集包含以下几个部分:
tmdb_movie_dataset(电影基本信息):
包含以下字段:
budget:电影预算。
genres:电影类型。
homepage:电影主页URL。
tmdbId:唯一的TMDB标识符。
keywords:电影关键词。
original_language:原始语言。
original_title:原始标题。
overview:电影简介。
popularity:电影受欢迎程度评分。
production_companies:制片公司。
production_countries:制片国家。
release_date:上映日期。
revenue:电影票房收入。
runtime:电影时长。
spoken_languages:使用的语言。
status:制作状态。
tagline:电影宣传语。
title:电影标题。
vote_average:用户平均评分。
vote_count:投票数量。
tmdb_movie_credits(电影演职员信息):
包含以下字段:
tmdbId:唯一的TMDB标识符。
title:电影标题。
cast:演员阵容。
crew:剧组人员。
tmdb_movie_ratings(电影用户评分):
包含以下字段:
userId:唯一的用户标识符。
tmdbId:唯一的电影标识符。
rating:用户评分。
timestamp:评分时间戳。
数据用途概述:
该数据集适用于多种分析和应用场景,包括:
高级预测模型构建:基于电影属性构建机器学习模型,预测用户评分。
深入探索性数据分析(EDA):揭示电影相关特征的细微趋势和模式,探索各种属性之间的相关性。
增强内容推荐:利用用户评分构建强大的推荐系统,提供个性化的电影推荐。
此外,该数据集也可用于电影票房预测、电影类型分析、观众情感分析、电影市场研究等。