-
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感极性, 机器学习, 语料库, 数据标注 数据概述:... -
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,数据集,文本分类,机器学习,深度学习,文本分析,人工智能 数据概述:... -
Yelp用户评论负样本数据集-che011
Yelp用户评论负样本数据集-che011 数据来源:互联网公开数据 标签:用户评论,负样本,情感分析,自然语言处理,数据集,机器学习,文本分类,Yelp 数据概述:该数据集包含来自Yelp平台的负样本用户评论数据,主要用于情感分析和文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了Yelp平台上较早期的用户评论。... -
多领域语义匹配数据集MSMARCOModifiedDataset-n068968
多领域语义匹配数据集MSMARCOModifiedDataset-n068968 数据来源:互联网公开数据 标签:自然语言处理,语义匹配,数据集,机器学习,信息检索,文本分类,深度学习,数据挖掘 数据概述: 该数据集是对MSMARCO数据集的改进版,包含来自多个领域的语义匹配数据,用于训练和评估文本匹配模型。主要特征如下:... -
问题文本语义相似度判别数据集QuestionTextSemanticSimilarityJudgement-ojasgolatkar
问题文本语义相似度判别数据集QuestionTextSemanticSimilarityJudgement-ojasgolatkar 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 问答系统, 语义分析, 文本分类, 机器学习, 深度学习, 数据标注 数据概述:... -
虚假新闻检测数据集LiarFakeNewsDetectionDataset-mubarakdaha
虚假新闻检测数据集LiarFakeNewsDetectionDataset-mubarakdaha 数据来源:互联网公开数据 标签:虚假新闻,事实核查,自然语言处理,文本分类,机器学习,新闻分析,舆情分析,社会科学 数据概述: 该数据集包含来自PolitiFact网站的虚假新闻和事实核查数据,用于训练和评估虚假新闻检测模型。主要特征如下:... -
土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin
土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻文章, 文本分类, 土耳其语, 内容分析, 类别识别, 自然语言处理, 机器学习, 语料库 数据概述: 该数据集包含来自土耳其TRT... -
词嵌入情感分析数据集D2VSentimentDataset-magomago
词嵌入情感分析数据集D2VSentimentDataset-magomago 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,词嵌入,深度学习,文本分类,机器学习,情感词典 数据概述: 该数据集包含用于情感分析任务的文本数据,结合了分布式词向量(Doc2Vec)技术,旨在研究和评估文本情感的表达和识别。主要特征如下: 时间跨度:... -
虚假评论分类数据集FakeReviewClassificationDataset-rahulluhar
虚假评论分类数据集FakeReviewClassificationDataset-rahulluhar 数据来源:互联网公开数据 标签:虚假评论,数据集,自然语言处理,文本分类,机器学习,电商分析,情感分析,数据挖掘 数据概述: 该数据集包含来自电商平台或社交媒体的评论数据,记录了用户对产品或服务的评价内容及其真实性标签。主要特征如下:... -
文本毒性分类嵌入数据集TextToxicityClassificationEmbeddingDataset-shikha130vv
文本毒性分类嵌入数据集TextToxicityClassificationEmbeddingDataset-shikha130vv 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 嵌入向量, 深度学习, 自然语言处理, 模型训练, 情感分析, 机器学习 数据概述: 该数据集包含用于训练和评估文本毒性分类模型的嵌入向量数据。主要特征如下:... -
Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat
Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,恶意内容检测,数据集,Quora,深度学习,情感分析,NLP 数据概述: 该数据集来自Jigsaw... -
电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif
电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了每条评论对应的情感极性标签。主要特征如下:... -
新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl
新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl 数据来源:互联网公开数据 标签:疫情, 微博, 情感分析, 自然语言处理, 文本分类, 社交媒体, 情感倾向, 中文文本 数据概述:... -
文本分类数据集SISTextClassificationDataset-senylar
文本分类数据集SISTextClassificationDataset-senylar 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息检索,人工智能 数据概述: 该数据集为SIS项目的一部分,主要包含用于文本分类任务的文本数据。主要特征如下:... -
文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh
文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,语言学,文本挖掘,文本分类,文本预处理 数据概述:该数据集包含了经过采样的文本数据,每段文本的字数限制在190字内,适用于自然语言处理和文本分析任务。主要特征如下:... -
数据2020年Shopee代码联赛情感分析数据集-rareloto
2020年Shopee代码联赛情感分析数据集-rareloto 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电商,Shopee,中文 数据概述: 该数据集来自2020年Shopee代码联赛,旨在用于情感分析任务,特别是针对电商平台上的用户评论。主要特征如下: 时间跨度:数据记录的时间范围为2020年。... -
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,数据集,中文,语言理解,文本分析,人工智能 数据概述: 该数据集是中文语言理解评测(CLUE)的一部分,主要包含中文文本的分类和标注数据,用于评估和训练自然语言处理模型。主要特征如下:... -
BotezLive直播聊天记录分类数据集-brandonbenton
BotezLive直播聊天记录分类数据集-brandonbenton 数据来源:互联网公开数据 标签:直播聊天,文本分类,数据集,机器学习,自然语言处理,游戏直播,社区互动,情感分析 数据概述: 该数据集包含了 BotezLive 直播平台的聊天记录,旨在用于文本分类和情感分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了... -
电影评论情感分析模型数据集MovieReviewSentimentAnalysisModelDataset-johnekarate
电影评论情感分析模型数据集MovieReviewSentimentAnalysisModelDataset-johnekarate 数据来源:互联网公开数据 标签:情感分析, 电影评论, 自然语言处理, 深度学习, 文本分类, 数据集, 机器学习, PyTorch模型 数据概述:... -
学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990
学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 语言学, 文本分类, 机器学习, 写作质量, 文本特征 数据概述: 该数据集包含学生写作文本,用于评估学生的写作水平。主要特征如下:...