漫威VSDCIMDB烂番茄电影数据集
数据来源:互联网公开数据
标签:漫威,DC,电影,IMDB,烂番茄,票房,评分,影评
数据概述:
该数据集收录了1944年至2020年间所有上映的漫威和DC真人电影记录,涵盖电影的基本信息、上映年份、电影类型、片长、MPAA分级、IMDB评分及投票数、总票房、导演、主演、电影描述、影评概要、烂番茄专业评分和观众评分等关键要素。数据来源于维基百科、IMDB和烂番茄等网站的公开信息,并经过验证确保内容的质量。
数据用途概述:
本数据集适用于电影行业分析、影评研究、票房预测和观众偏好分析等多种场景。研究者可以通过分析电影类型、评分和票房数据,探索漫威和DC电影的市场表现和观众喜好;影评人可以利用影评概要和评分数据,对比不同电影的评价差异;投资机构也能通过票房和评分数据,评估电影的投资价值。此外,该数据集还适合用于教育培训,帮助学习者了解电影行业的运作机制和市场趋势。
举例:
数据集包含以下字段:
- TITLE:电影名称(分类-名义)
- YEAR:上映年份(数值-连续)
- GENRE:电影类型(分类-名义)
- RUNTIME:片长(分钟)(数值-连续)
- MPA_RATING:MPAA分级(分类-有序)
- IMDB_RATING:IMDB评分(数值-离散)
- IMDB_VOTES:IMDB投票数(数值-连续)
- GROSS:总票房(数值-连续)
- DIRECTOR:导演(分类-名义)
- STARS:主演(分类-名义)
- DESCRIPTION:电影描述(文本)
- CRIT_CONSENSUS:影评概要(文本)
- TOMATO_METER:烂番茄专业评分百分比(数值-连续)
- TOMATO_REVIEW:烂番茄专业评分总数量(数值-连续)
- TOM_AUD_SCORE:烂番茄观众评分百分比(数值-连续)
- TOM_RATINGS:烂番茄观众评分总数量(数值-连续)
- ENTITY:电影所属实体(漫威/DC)(分类-名义)