电影评论情感分析数据集-2024年-delwarshahadat

电影评论情感分析数据集-2024年-delwarshahadat 数据来源:互联网公开数据 标签:电影,评论,情感分析,YouTube,BERT,票房,电影数据,观众反馈 数据概述: 本数据集整合了截至2024年的所有电影信息,数据来源于The Numbers网站。通过OMDb API获取每部电影的详细信息,并利用YouTube API抓取电影预告片的评论。仅收集电影上映日期之前的评论。

收集到的评论经过清洗,移除了表情符号、无用行和空条目。随后,使用BERT模型对评论进行情感分类。BERT模型通过Kaggle上的电影评论数据集进行微调。最终,将电影详细信息与情感分析结果合并,形成了最终的电影数据集。数据集中,“Negative”表示负面评论的数量,“Positive”表示正面评论的数量。

数据用途概述: 该数据集适用于电影票房预测、观众情感分析、电影营销策略制定等多种场景。研究人员可以利用此数据分析评论情绪与票房之间的关系;电影公司可以根据评论情绪调整宣传策略;市场分析师可以利用此数据进行市场趋势预测。此外,该数据集还可用于构建推荐系统,更好地为用户提供个性化电影推荐。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 06:25 (UTC)
创建于 五月 31, 2025, 06:24 (UTC)