-
真实与虚假新闻文章数据集TrueandFakeArticlesDataset-johnbelozerov
真实与虚假新闻文章数据集TrueandFakeArticlesDataset-johnbelozerov 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,文本分类,机器学习,自然语言处理,信息传播,媒体研究 数据概述: 该数据集包含来自多个新闻来源的真实与虚假新闻文章,记录了新闻文章的特征和分类标签。主要特征如下:... -
泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja
泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja 数据来源:互联网公开数据 标签:维基百科,泰卢固语,文本分析,自然语言处理,数据集,语言学,信息检索,文本挖掘 数据概述: 该数据集包含来自泰卢固语维基百科的文章数据,记录了泰卢固语维基百科中所有文章的详细信息。主要特征如下:... -
文本生成检测机器学习数据集TextGenerationDetectionMLDataset-scottsang
文本生成检测机器学习数据集TextGenerationDetectionMLDataset-scottsang 数据来源:互联网公开数据 标签:文本生成,检测,数据集,机器学习,自然语言处理,深度学习,人工智能,数据科学 数据概述:该数据集包含来自多个来源的文本数据,记录了真实文本与机器生成文本的样本,适用于文本生成检测和机器学习任务。主要特征如下:... -
脸书帖子情感分析增强数据集FacebookPostSentimentAnalysisEnhancedDataset-shiladitya10
脸书帖子情感分析增强数据集FacebookPostSentimentAnalysisEnhancedDataset-shiladitya10 数据来源:互联网公开数据 标签:情感分析,社交媒体,脸书,文本数据,自然语言处理,机器学习,情感分类,数据增强 数据概述:... -
印度新闻头条数据集IndiaNewsHeadlineDataset-srsujon
印度新闻头条数据集IndiaNewsHeadlineDataset-srsujon 数据来源:互联网公开数据 标签:新闻头条,数据集,自然语言处理,文本分析,情感分析,机器学习,信息检索,媒体研究 数据概述:该数据集包含来自印度主要新闻媒体的新闻头条数据,记录了不同时间段的新闻标题。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2022年。... -
孟加拉语文本相似度判断数据集BengaliTextSimilarityDetectionDataset-nilarnabdebnath
孟加拉语文本相似度判断数据集BengaliTextSimilarityDetectionDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:文本相似度, 孟加拉语, 自然语言处理, 文本匹配, 语义分析, 二分类, 语料库, 机器翻译 数据概述:... -
文本相似度分析测试数据集TextSimilarityAnalysisTestDataset-polapob
文本相似度分析测试数据集TextSimilarityAnalysisTestDataset-polapob 数据来源:互联网公开数据 标签:文本相似度, 语义分析, 文本匹配, 数据集构建, 自然语言处理, 机器学习, 语料库, 向量化 数据概述: 该数据集包含用于测试文本相似度分析的语料,记录了文本对之间的相似度关系。主要特征如下:... -
Yelp商家评价数据集YelpBusinessReviewDataset-ckjtam
Yelp商家评价数据集YelpBusinessReviewDataset-ckjtam 数据来源:互联网公开数据 标签:商评分析,数据集,机器学习,自然语言处理,情感分析,商业智能,客户评价, Yelp平台 数据概述: 该数据集包含来自Yelp平台(美国最大的商家评价和推荐网站之一)的商家评价数据,记录了用户对商家的评价内容和相关信息。主要特征如下:... -
arXiv论文数据集arXivDataset-abhishekydav
arXiv论文数据集arXivDataset-abhishekydav 数据来源:互联网公开数据 标签:arXiv, 论文数据, 机器学习, 数据挖掘, 学术研究, 自然语言处理, 科技文献, 信息检索 数据概述:该数据集包含来自arXiv的学术论文数据,记录了大量科学和技术领域的研究论文信息。主要特征如下:... -
标签数据集Labelds-v4DataSet-kunihikofurugori
标签数据集Labelds-v4DataSet-kunihikofurugori 数据来源:互联网公开数据 标签:标签,数据集,分类,机器学习,数据标注,自然语言处理,数据挖掘,人工智能 数据概述: 该数据集包含标签数据,记录了各类数据的标签信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
新闻文本摘要生成数据集NewsTextSummarizationDataset-mamatva
新闻文本摘要生成数据集NewsTextSummarizationDataset-mamatva 数据来源:互联网公开数据 标签:文本摘要, 新闻文章, 自然语言处理, 文本生成, 机器翻译, 数据集, 深度学习, 文本分析 数据概述: 该数据集包含来自新闻网站的英文新闻文章及其对应的标题和摘要,主要用于训练和评估文本摘要模型。主要特征如下:... -
自然语言处理聊天机器人数据集NLPChatbotData-shekhartiruwa25
自然语言处理聊天机器人数据集NLPChatbotData-shekhartiruwa25 数据来源:互联网公开数据 标签:自然语言处理,聊天机器人,数据集,对话系统,机器学习,文本分析,人工智能,语言模型 数据概述: 该数据集包含来自公开来源的自然语言处理聊天机器人对话数据,记录了用户与聊天机器人的交互内容。主要特征如下:... -
评论情感预测评分提交数据集CommentSentimentPredictionScoreSubmission-toongzhhang
评论情感预测评分提交数据集CommentSentimentPredictionScoreSubmission-toongzhhang 数据来源:互联网公开数据 标签:情感分析, 文本分类, 评分预测, 机器学习, 自然语言处理, 模型评估, 数据提交, 社交媒体 数据概述:... -
社交媒体评论文本毒性分析数据集SocialMediaCommentToxicityAnalysis-pavelpoletaev
社交媒体评论文本毒性分析数据集SocialMediaCommentToxicityAnalysis-pavelpoletaev 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 自然语言处理, 情感分析, 机器学习, 评论分析, 文本向量化, 语料库 数据概述:... -
英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar
英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,德语,文本翻译,深度学习,语言技术 数据概述: 该数据集来源于WMT(Workshop on Machine... -
越南语文本分类数据集VietnameseTextClassificationDataset-hoangviettung
越南语文本分类数据集VietnameseTextClassificationDataset-hoangviettung 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 越南语, 多分类, 情感分析, 文本清洗, 机器学习, 深度学习 数据概述: 该数据集包含来自越南互联网的文本数据,记录了用于多类别文本分类的越南语文本示例。主要特征如下:... -
越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl
越南社交媒体用户情感分析数据集VietnameseSocialMediaSentimentAnalysisDataset-thanhphongl 数据来源:互联网公开数据 标签:越南语,情感分析,社交媒体,数据集,自然语言处理,文本分析,机器学习,NLP 数据概述: 该数据集包含了来自越南社交媒体平台的用户文本数据,主要用于情感分析任务。主要特征如下:... -
互联网新闻综合数据集TheNewCombinedDatasets-mahmoudabusaqer
互联网新闻综合数据集TheNewCombinedDatasets-mahmoudabusaqer 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,社会研究,媒体研究,信息学 数据概述:该数据集由多个互联网新闻来源整合而成,记录了广泛范围内的新闻文章内容。主要特征如下:... -
中文文本情感分析数据集ChineseTextSentimentAnalysisDataset-kristinzhang2333
中文文本情感分析数据集ChineseTextSentimentAnalysisDataset-kristinzhang2333 数据来源:互联网公开数据 标签:情感分析, 文本分类, 中文文本, 自然语言处理, 情感极性, 机器学习, 数据标注, 情感词典 数据概述:... -
COVID-19疫情文献分析数据集COVID-19PandemicLiteratureAnalysis-houssemayed
COVID-19疫情文献分析数据集COVID-19PandemicLiteratureAnalysis-houssemayed 数据来源:互联网公开数据 标签:COVID-19, 疫情, 医学文献, 文本分析, 疾病传播, 流行病学, 数据挖掘, 自然语言处理 数据概述:...