亚马逊电子产品用户评价情感分析数据集-2018年
数据来源:互联网公开数据
标签:亚马逊,电子产品,用户评价,情感分析,文本挖掘,评分,评论,NLP,自然语言处理
数据概述:
本数据集是亚马逊2018年电子产品评论数据集的子集,包含了用户对电子产品的评价信息。为了保证数据的质量和可用性,数据集经过筛选,仅保留了5-core数据,即每位用户和每个产品至少有5条评论。数据包含评论文本、评分、评价时间等关键信息。
数据字段包括:
overall:产品评分(1到5星)
vote:评论的有用投票数量
reviewText:评论的文本内容
summary:评论的摘要
reviewTime:评论时间(原始格式)
数据来源:
原始数据来自于Amazon Review Data (2018),该数据集是2014年发布的亚马逊评论数据集的更新版本。
原始论文:
Justifying recommendations using distantly-labeled reviews and fined-grained aspects
Jianmo Ni, Jiacheng Li, Julian McAuley
Empirical Methods in Natural Language Processing (EMNLP), 2019
数据用途概述:
该数据集适用于多种自然语言处理(NLP)和情感分析任务。研究人员可以利用此数据进行情感分析,预测用户对产品的态度;可以进行文本挖掘,提取用户评价中的关键信息;还可以用于构建推荐系统,根据用户评论推荐产品。此外,该数据集也适合用于NLP教学,帮助学习者理解文本数据的处理和分析。