亚马逊电影评论情感分析数据集-2018-pragatidode

亚马逊电影评论情感分析数据集-2018-pragatidode 数据来源:互联网公开数据 标签:亚马逊,电影评论,情感分析,NLP,文本分类,数据集,UCSD

数据概述: 本数据集包含约500万条标注的亚马逊电影评论,适用于自然语言处理(NLP)分类任务,如情感分析或文本分类。这些评论最初由加利福尼亚大学圣地亚哥分校于2014年收集。2018年,数据集更新并进一步处理和标注了情感(正面/负面/中性)。本版本的数据集仅包含评论文本及其相应的情感标签,没有其他元数据。

为了计算情感得分,探索了多种方法,包括正面/负面词汇表、NLTK的VADER情感强度分析器和SentiWordNet。本数据集版本使用SentiWordNet对评论进行标注。

数据用途概述: 该数据集是用于实验不同文本分类方法和探索各种评论情感标注方式的宝贵资源。鼓励Kaggle社区尝试不同的分类模型或采用替代的情感标注策略。如需包含元数据(如风格、评论时间、投票、图片等)的完整数据集,请访问加利福尼亚大学圣地亚哥分校提供的原始数据集:https://nijianmo.github.io/amazon/index.html

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 36.9 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。