美国电影维基百科数据-1970年代至2020年代

美国电影维基百科数据-1970年代至2020年代 数据来源:互联网公开数据 标签:电影,美国,维基百科,剧情,标题,图像,NLP,机器学习,推荐系统 数据概述: 本数据集包含了1970年代至2020年代期间,从维基百科上获取的美国电影详细信息,共计近18,000部电影。数据通过维基百科API进行收集,主要来源于维基百科页面。数据集以CSV格式提供,包含电影标题、图像链接和剧情梗概等关键字段。

数据筛选标准:

电影必须在维基百科上拥有页面,且符合以下条件:

出现在分类:{年代}s_American_films 包含“剧情”章节(而非“概要”或“总结”章节) 包含非维基百科占位符图像(例如:File:Question_Mark.svg) 数据用途概述: 该数据集适用于自然语言处理(NLP)和机器学习任务,例如构建电影推荐系统、进行电影剧情分析、研究电影题材演变等。研究人员可以使用该数据进行情感分析、主题建模、文本分类等,从而深入理解电影内容和观众偏好。数据集也适合用于教育目的,例如电影研究、数据科学教学等。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 21.24 MiB
最后更新 2025年4月19日
创建于 2025年4月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。