-
社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411
社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411 数据来源:互联网公开数据 标签:社交媒体,语言识别,数据集,文本分析,机器学习,自然语言处理,情感分析,西班牙语 数据概述:... -
语言检测数据集LanguageDetectionDataset-trinhtung
语言检测数据集LanguageDetectionDataset-trinhtung 数据来源:互联网公开数据 标签:语言检测,自然语言处理,数据集,文本分析,机器学习,人工智能,数据科学,语言学 数据概述: 该数据集包含来自多个来源的文本数据,用于语言检测任务。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。 地理范围:... -
情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf
情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,NLP,二分类,情感倾向 数据概述: 该数据集包含来自斯坦福情感树库(Stanford Sentiment Treebank, SST)的情感倾向分类数据,记录了句子的情感极性。主要特征如下:... -
垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab
垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,数据集,机器学习,邮件过滤,文本分析,信息检索 数据概述:该数据集包含来自SpamAssassin项目的邮件数据,用于训练和测试垃圾邮件过滤系统。主要特征如下:... -
多语言翻译标签数据集TagsandTranslationDataset-outlook0
多语言翻译标签数据集TagsandTranslationDataset-outlook0 数据来源:互联网公开数据 标签:多语言翻译,数据集,标签管理,自然语言处理,机器翻译,文本分析,数据科学,信息处理 数据概述: 该数据集包含了来自多个来源的标签及其多语言翻译,适用于标签管理和多语言系统的构建。主要特征如下:... -
摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine
摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,情感分析,机器学习,自然语言处理,情感研究,多语言处理 数据概述:该数据集包含来自摩洛哥社交媒体平台的推文数据,记录了用户发布的推文内容及情感倾向。主要特征如下:... -
泰国新闻分类数据集ThaiNewsClassificationDataset-mssjss
泰国新闻分类数据集ThaiNewsClassificationDataset-mssjss 数据来源:互联网公开数据 标签:新闻分类,文本处理,数据集,机器学习,自然语言处理,多语言,信息检索,数据挖掘 数据概述: 该数据集包含来自泰国新闻网站的新闻文章数据,记录了不同类别新闻的分类信息。主要特征如下:... -
电影评论情感分析数据集MovieCommentSentimentAnalysisDataset-chavdadhruv
电影评论情感分析数据集MovieCommentSentimentAnalysisDataset-chavdadhruv 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,文本挖掘,机器学习,情感分类,影评 数据概述: 该数据集包含了来自互联网的电影评论数据,用于情感分析任务。主要特征如下:... -
自然语言处理数据集ANLP概览-ankitmakhija98
自然语言处理数据集ANLP概览-ankitmakhija98 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,NLP,语料库,语言模型,人工智能 数据概述: 该数据集汇总了各种自然语言处理(NLP)数据集,涵盖了文本分类,情感分析,机器翻译,文本生成,问答系统等多种NLP任务。主要特征如下: 时间跨度:... -
虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych
虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych 数据来源:互联网公开数据 标签:新闻分析,虚假新闻,数据集,文本分类,机器学习,自然语言处理,传播学,信息安全 数据概述: 该数据集包含来自互联网公开渠道的新闻文章数据,记录了真假新闻的特征和标签。主要特征如下:... -
数据2019年印度尼西亚总统选举推特数据集Pilpres2019TweetDataset-shaniasalsabillaq
2019年印度尼西亚总统选举推特数据集Pilpres2019TweetDataset-shaniasalsabillaq 数据来源:互联网公开数据 标签:推特,社交媒体,政治,选举,情感分析,自然语言处理,印度尼西亚,数据集 数据概述: 该数据集包含了来自推特(Twitter)的公开数据,记录了关于2019年印度尼西亚总统选举的推文信息。主要特征如下:... -
多分类电子邮件数据集-amalverma27
多分类电子邮件数据集-amalverma27 数据来源:互联网公开数据 标签:电子邮件,文本分类,垃圾邮件检测,自然语言处理,机器学习,数据集,邮件安全,信息检索 数据概述: 该数据集包含电子邮件数据,旨在用于文本分类和垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但包含历史邮件数据。... -
客户服务口语评估数据集-bitext
客户服务口语评估数据集-bitext 数据来源:互联网公开数据 标签:客户服务,口语评估,数据集,自然语言处理,情感分析,对话分析,机器学习,语音识别 数据概述: 该数据集包含客户服务领域的口语对话数据,用于评估和分析客户服务中的口语表达。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的客户服务对话。... -
程序员Facebook帖子互动数据集ProgrammerFacebookPostEngagementDataset-purwonopurwono
程序员Facebook帖子互动数据集ProgrammerFacebookPostEngagementDataset-purwonopurwono 数据来源:互联网公开数据 标签:社交媒体,程序员,Facebook,帖子互动,数据分析,自然语言处理,机器学习,用户行为 数据概述:... -
电影流派数据集GenresDataset-bambii21
电影流派数据集GenresDataset-bambii21 数据来源:互联网公开数据 标签:电影,流派,数据集,电影分析,推荐系统,自然语言处理,文化研究,娱乐行业 数据概述: 该数据集包含来自公开电影数据库的数据,记录了不同电影的流派信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。... -
藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx
藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx 数据来源:互联网公开数据 标签:藏文文献,命名实体识别,数据集,自然语言处理,机器学习,学术研究,文本分析,语言学 数据概述:该数据集包含来自藏文文献的引文数据,用于命名实体识别(NER)任务。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述: 该数据集包含来自维基百科的法语语言内容,记录了多个领域的百科全书条目。主要特征如下:... -
银行客户评论数据集BankCustomerReviewsDataset-romanberdyshev
银行客户评论数据集BankCustomerReviewsDataset-romanberdyshev 数据来源:互联网公开数据 标签:银行评论,数据集,客户反馈,情感分析,金融行业,客户服务,用户体验,自然语言处理 数据概述: 该数据集包含来自不同银行客户的评论数据,记录了客户对银行服务的反馈和评价。主要特征如下:... -
苏萨索人工智能数据集SUSATHOAIDataset-saniyatlamim007
苏萨索人工智能数据集SUSATHOAIDataset-saniyatlamim007 数据来源:互联网公开数据 标签:人工智能,数据集,机器学习,自然语言处理,图像识别,深度学习,计算机视觉,智能技术 数据概述: 该数据集包含来自苏萨索的研究数据,记录了人工智能领域的研究进展,应用案例和技术方法。主要特征如下:... -
立场检测数据集StanceDetectionDataset-ad6398
立场检测数据集StanceDetectionDataset-ad6398 数据来源:互联网公开数据 标签:立场检测,文本分析,自然语言处理,数据集,情感分析,观点挖掘,机器学习,舆情分析 数据概述: 该数据集包含用于立场检测任务的文本数据,旨在识别文本中对特定目标或主题的立场。主要特征如下:...