-
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa 数据来源:互联网公开数据 标签:医学,摘要,文本分类,自然语言处理,机器学习,医疗健康,语料库,医学文献 数据概述: 该数据集包含来自医学文献的摘要文本,用于文本分类任务。主要特征如下:... -
通用语言理解评估数据集GLUEDataset-ankitchettri
通用语言理解评估数据集GLUEDataset-ankitchettri 数据来源:互联网公开数据 标签:自然语言处理,语言理解,数据集,机器学习,文本分类,语义分析,人工智能,深度学习 数据概述: 该数据集为通用语言理解评估(GLUE)项目提供的数据集,包含多种自然语言处理任务的数据,记录了不同语言理解任务的数据样本。主要特征如下:... -
马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu
马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu 数据来源:互联网公开数据 标签:新闻,语言分析,数据集,自然语言处理,文本分类,机器学习,印度语言,数据挖掘 数据概述: 该数据集包含来自马拉地语新闻媒体的文章,记录了马拉地语新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2018年。... -
数据2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050
2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,反讽识别,机器学习,文本分类,语言学,情感计算 数据概述: 该数据集由2014年计算语言学协会(ACL)会议提供,专注于社交媒体文本中的反讽识别任务。主要特征如下:... -
文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn
文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,信息检索,文本分析,知识图谱,学术研究 数据概述: 该数据集包含来自多个来源的文章主题分类数据,记录了各类文章的主题标签和内容。主要特征如下:... -
短信垃圾邮件检测数据集SMSSpamDetectionDataset-raheebemad
短信垃圾邮件检测数据集SMSSpamDetectionDataset-raheebemad 数据来源:互联网公开数据 标签:短信,垃圾邮件,数据集,自然语言处理,文本分类,机器学习,数据挖掘,信息安全 数据概述: 该数据集包含短信文本数据,用于垃圾短信检测。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了收集这些短信的时间段。... -
垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11
垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11 数据来源:互联网公开数据 标签:垃圾邮件,短信,自然语言处理,文本分类,机器学习,数据集,情感分析,信息安全 数据概述: 该数据集包含来自公开渠道的短信数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了收集数据的时期。... -
轻量级有毒评论数据集ToxicLiteDataset-justinluu
轻量级有毒评论数据集ToxicLiteDataset-justinluu 数据来源:互联网公开数据 标签:文本分析,自然语言处理,情感分析,数据集,机器学习,有毒评论,社交媒体,文本分类 数据概述: 该数据集包含来自社交媒体平台(如Twitter,Reddit等)的评论数据,记录了评论的文本内容及其有毒性标签。主要特征如下:... -
情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri
情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,BERT模型,机器学习,文本分类,深度学习,人工智能 数据概述: 该数据集专注于情感分析任务,基于BERT-... -
GermEval18文本分类数据集-thedevastator
GermEval18文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习 数据概述:... -
泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad
泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad 数据来源:互联网公开数据 标签:泰迪QA,多语言问答,数据集,自然语言处理,机器学习,文本分类,语言理解,计算机辅助翻译 数据概述: 该数据集包含来自泰迪QA(TYDI... -
网络欺凌分类数据集CyberbullyingClassificationDataset-mos3santos
网络欺凌分类数据集CyberbullyingClassificationDataset-mos3santos 数据来源:互联网公开数据 标签:网络欺凌,文本分类,自然语言处理,情感分析,社交媒体,机器学习,欺凌检测,文本数据 数据概述:... -
虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi
虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi 数据来源:互联网公开数据 标签:新闻,虚假新闻,真实新闻,自然语言处理,文本分类,机器学习,舆情分析,信息检索 数据概述: 该数据集包含了来自不同来源的虚假新闻和真实新闻数据,用于训练和评估虚假新闻检测模型。主要特征如下:... -
文本分类数据集TextClassificationDataset-quanghuyho06
文本分类数据集TextClassificationDataset-quanghuyho06 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,主题建模,文本分析,人工智能 数据概述: 该数据集包含用于文本分类任务的多种文本数据,涵盖了不同领域和主题。主要特征如下:... -
虚假评论检测数据集FakeReviewDetectionDataset-uselessguy
虚假评论检测数据集FakeReviewDetectionDataset-uselessguy 数据来源:互联网公开数据 标签:虚假评论,情感分析,自然语言处理,文本分类,机器学习,评论分析,欺诈检测,社交媒体 数据概述: 该数据集包含来自不同来源的评论数据,主要用于检测虚假评论。主要特征如下: 时间跨度:... -
垃圾邮件过滤数据集-aymendernani
垃圾邮件过滤数据集-aymendernani 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,机器学习,邮件过滤,数据集,信息检索,人工智能 数据概述: 该数据集包含来自不同来源的邮件数据,用于垃圾邮件过滤任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时期的邮件数据。... -
基于BERT模型的社交媒体情感分析数据集-rahulshelke98
基于BERT模型的社交媒体情感分析数据集-rahulshelke98 数据来源:互联网公开数据 标签:情感分析,自然语言处理,BERT,文本分类,社交媒体,数据集,机器学习,情感识别 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于情感分析任务,旨在识别文本所表达的情感倾向。主要特征如下:... -
网络攻击分类数据集WebAttackClassificationDataset-zhourui0712
网络攻击分类数据集WebAttackClassificationDataset-zhourui0712 数据来源:互联网公开数据 标签:网络安全,攻击检测,数据集,机器学习,文本分类,恶意流量,威胁情报,安全分析 数据概述: 该数据集包含了用于网络攻击分类的流量数据,记录了各种类型的网络攻击行为。主要特征如下:... -
-
自然语言处理基础数据集NLPDataset1-kryusufkaya
自然语言处理基础数据集NLPDataset1-kryusufkaya 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,文本分类,情感分析,信息提取 数据概述: 该数据集包含来自互联网的公开文本数据,记录了多种自然语言处理任务的基础文本信息。主要特征如下: 时间跨度:数据记录的时间范围未明确标注,涵盖多个时间段。...