Yelp商家评价情感分析二元分类数据集-训练与测试-yacharki

Yelp商家评价情感分析二元分类数据集-训练与测试-yacharki 数据来源:互联网公开数据 标签:Yelp,评价,情感分析,二元分类,文本数据,机器学习,自然语言处理,情感极性

数据概述: 本数据集用于Yelp商家评价的情感分析研究,采用二元分类方法。数据构建基于Yelp用户对商家的星级评分,将1星和2星的评价定义为负面情感(类别1),将3星和4星的评价定义为正面情感(类别2)。数据集包含训练集和测试集,其中训练集包含560,000个样本,测试集包含38,000个样本。每个样本包含两个字段:类别索引(1或2,分别代表负面和正面情感)和评价文本。评价文本使用双引号(")进行转义,内部的双引号使用两个双引号("")转义,换行符使用反斜杠后跟“n”(\n)转义。

数据用途概述: 该数据集主要用于情感分析模型的训练和测试。研究人员可以使用该数据集开发和评估文本情感分类算法,例如,自然语言处理(NLP)模型、机器学习模型等。具体应用包括:情感分析、舆情监测、产品评论分析、用户反馈分析等。通过对Yelp评价文本的分析,可以帮助企业了解用户对产品的真实感受,改进产品和服务,并进行市场营销策略的制定。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 18:13 (UTC)
创建于 五月 31, 2025, 18:13 (UTC)