Douban_Movie_Information_and_Online_Reviews_2022

数据集概述

本数据集包含豆瓣平台上224部中国上映电影的相关信息,分为电影基本信息、索引文件和原始评论三个部分。数据覆盖电影的基础属性、评论内容及互动数据,可用于影视内容分析、用户评论研究等场景,总计包含3个JSON格式文件。

文件详解

  • douban.movies.json
  • 文件格式:JSON
  • 字段映射介绍:包含电影的豆瓣ID、名称、评分、演职员列表、上映时间、类型、票房成绩、评分数据及官方报道提及次数等基础信息。
  • index.json
  • 文件格式:JSON
  • 字段映射介绍:对应论文中提及的索引文件,具体内容未详细说明。
  • original_comments.json
  • 文件格式:JSON
  • 字段映射介绍:包含原始中文短评内容、评论发布时间及截至2022年9月的“有用”互动次数。

适用场景

  • 影视内容分析:研究电影类型、票房与评分的相关性,分析不同类型电影的市场表现。
  • 用户评论研究:挖掘用户对电影的评价倾向、情感极性及热门评论话题。
  • 电影推荐系统开发:基于电影属性和用户评论数据,构建个性化电影推荐模型。
  • 影视行业趋势分析:通过电影上映时间、类型分布等数据,洞察中国电影市场的发展趋势。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 44.17 MiB
最后更新 2026年1月8日
创建于 2026年1月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。