-
IMDB电影评论情感分析数据集-2021-mirnasherif
IMDB电影评论情感分析数据集-2021-mirnasherif 数据来源:互联网公开数据 标签:IMDB,电影评论,情感分析,NLP,文本分析,机器学习,深度学习,自然语言处理 数据概述: 本数据集来源于IMDB,包含332,220条电影评论,以及对应的电影标题和IMDB的唯一标识符(tconst),旨在支持情感分析任务。数据集包含以下字段:...
-
机器学习领域ArXiv论文数据集-2021年5月11日至2023年5月11日-practiceportfolio
机器学习领域ArXiv论文数据集-2021年5月11日至2023年5月11日-practiceportfolio 数据来源:互联网公开数据 标签:机器学习,NLP,ArXiv,论文数据集,Kaggle,人工智能挑战,科学研究,学术论文 数据概述:...
-
OpenHermes模型训练数据集通用指令与角色扮演数据集合集-volodymyrpivoshenko
OpenHermes模型训练数据集通用指令与角色扮演数据集合集-volodymyrpivoshenko 数据来源:互联网公开数据 标签:OpenHermes,GPT-4,指令数据集,角色扮演,代码指令,AI,机器学习,NLP,Teknium,WizardLM,Airoboros GPT-4,Camel-...
-
孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan
孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan 数据来源:互联网公开数据 标签:孟加拉语,新闻,文本,自然语言处理,NLP,文本分析,孟加拉国,BD-Pratidin,语料库 数据概述: 本数据集包含了从2017年12月13日至2020年9月9日期间,孟加拉国日报(BD-...
-
Steam游戏数据集-2023-deepann
Steam游戏数据集-2023-deepann 数据来源:互联网公开数据 标签:Steam,游戏,数据集,游戏信息,数据清洗,数据分析,NLP,教育,研究 数据概述:...
-
土耳其新闻摘要句子数据集-serdarcaglar
土耳其新闻摘要句子数据集-serdarcaglar 数据来源:互联网公开数据 标签:土耳其,新闻摘要,自然语言处理,NLP,文本挖掘,语言模型,文本分类,文本聚类,词嵌入,文本提取 数据概述:...
-
土耳其语维基百科页面链接与内容数据集-2020年4月-korsavasci
土耳其语维基百科页面链接与内容数据集-2020年4月-korsavasci 数据来源:互联网公开数据 标签:维基百科,土耳其语,NLP,自然语言处理,页面链接,文本数据,知识图谱,推荐系统,语料库 数据概述: 本数据集基于2020年4月1日的土耳其语维基百科数据转储生成,旨在为土耳其语自然语言处理(NLP)任务提供支持。数据集包含两类主要文件:...
-
IMDB电影评论情感分析数据集-2019年
IMDB电影评论情感分析数据集-2019年 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本数据,IMDB,评论数据,电影,情感,NLP 数据概述:...
-
-
最终清洗数据集-自然语言处理与情感分类场景
最终清洗数据集-自然语言处理与情感分类场景 数据来源:互联网公开数据 标签:NLP,情感分类,数据清洗,文本分析,机器学习,数据集 数据概述: 本数据集经过最终清洗处理,适用于建模和各种自然语言处理(NLP)任务。数据包含经过预处理的文本信息,适用于情感分类等应用场景。数据集已经完成了必要的清理步骤,确保数据质量和一致性。 数据用途概述:...
-
-
数据2020年美国大选推文数据集
数据2020年美国大选推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,情感分析,选举,政治,NLP,文本挖掘,舆论分析,数据科学 数据概述: 本数据集包含了2020年美国大选前两周(10月18日至11月1日)收集的439,999条推文,数据通过Twitter API和Tweepy...
-
MLQA多语言问答数据集2021-thedevastator
MLQA多语言问答数据集2021-thedevastator 数据来源:互联网公开数据 标签:多语言,问答系统,NLP,机器学习,数据集,公开数据,模型评估,跨语言学习 数据概述:...
-
TripAdvisor旅行评论数据集-用于NLP任务-2021
TripAdvisor旅行评论数据集-用于NLP任务-2021 数据来源:互联网公开数据 标签:TripAdvisor,旅行评论,自然语言处理,NLP,数据分析,机器学习,情感分析,个性化推荐,文本摘要 数据概述:...
-
社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer
社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer 数据来源:互联网公开数据 标签:社交媒体,虚假新闻,NLP,文本分类,机器学习,自然语言处理,信息检索,谣言检测 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于虚假新闻的检测与分析。主要特征如下:...
-
越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl
越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl 数据来源:互联网公开数据 标签:越南语,情感分析,社交媒体,数据集,自然语言处理,文本分析,机器学习,NLP 数据概述: 该数据集包含了来自越南社交媒体平台的用户文本数据,主要用于情感分析任务。主要特征如下:...
-
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan 数据来源:互联网公开数据 标签:自然语言处理,情感分析,越南语,数据集,文本分类,机器学习,语言学,NLP 数据概述: 该数据集包含用于评估越南语情感分析模型的测试数据,记录了越南语文本的情感极性。主要特征如下:...
-
Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills
Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,情感分析,恶意评论,数据集,社交媒体,NLP 数据概述: 该数据集由 Jigsaw 团队提供,旨在用于检测在线评论中的恶意、侮辱性和攻击性言论。主要特征如下:...
-
印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall
印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall 数据来源:互联网公开数据 标签:机器翻译,英印翻译,自然语言处理,数据集,语言学,文本数据,人工智能,NLP 数据概述:...
-
推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch
推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,自然语言处理,机器学习,文本分析,舆情分析,NLP 数据概述: 该数据集包含来自推特(Twitter)的推文数据,主要用于情感分析研究。主要特征如下:...



