宝莱坞电影数据集-2023-mustafaanandwala
数据来源:互联网公开数据
标签:宝莱坞,电影,IMDb,电影评分,演员,导演,电影时长,票数,剧情描述,数据抓取
数据概述:
本数据集包含10,000部宝莱坞电影的相关信息,涵盖了从2023年发布的电影。数据集中的每一条记录提供了电影的基本信息,包括IMDb电影ID、电影名称、IMDb评分、上映年份、电影时长、投票人数、剧情描述、导演和主要演员等。
数据集中的关键字段定义如下:
- Imdb ID:电影在IMDb上的唯一标识符
- Title:电影的标题
- IMDB rating:电影在IMDb上的评分
- Year:电影的上映年份
- runtime:电影的时长
- no of votes:电影获得的投票数
- Plot description:电影的剧情描述
- Directors:电影的导演姓名
- Actors:电影的主要演员姓名
数据集通过BeautifulSoup库从多个网页抓取而来,包含的数据信息丰富,适合进行各种电影数据分析。
数据用途概述:
该数据集适用于电影研究、数据分析、推荐系统开发、电影产业趋势分析等多种场景。研究人员可以利用此数据集进行电影行业的市场分析;电影爱好者可以通过数据分析了解电影的受欢迎程度;教育机构可以使用数据集进行电影分析课程的教学;数据科学家可以使用数据集进行机器学习模型的训练和测试。此外,该数据集还可以用于电影推荐系统的开发,帮助用户发现感兴趣的电影。