-
推文情感预测数据集TweetSentimentPredictionDataset-dinoooo9
推文情感预测数据集TweetSentimentPredictionDataset-dinoooo9 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本分析,数据挖掘,情感识别 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的内容及其对应的情感标签。主要特征如下:... -
维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk
维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk 数据来源:互联网公开数据 标签:维基百科,文章向量,自然语言处理,数据集,机器学习,文本分析,词嵌入,信息检索 数据概述: 该数据集包含来自维基百科的文章向量数据,记录了维基百科文章的词嵌入向量。主要特征如下: 时间跨度:... -
越南语翻译数据集VietnameseTranslateDataset-tranvannhan1911
越南语翻译数据集VietnameseTranslateDataset-tranvannhan1911 数据来源:互联网公开数据 标签:语言学习,翻译,数据集,自然语言处理,机器学习,越南语,文本分析,语言技术 数据概述: 该数据集包含来自越南语翻译项目的数据,记录了越南语与其它语言(如英语,中文等)之间的翻译数据。主要特征如下:... -
文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser
文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser 数据来源:互联网公开数据 标签:文本分析,TF-IDF,数据集,自然语言处理,机器学习,信息检索,文本挖掘,文本特征 数据概述: 该数据集包含来自公开提交的文本特征提取数据,记录了通过TF-IDF方法提取的文本特征。主要特征如下:... -
命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin
命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin 数据来源:互联网公开数据 标签:命名实体识别, 数据集, 自然语言处理, 机器学习, Keras, 人工智能, 文本分析, 语义理解 数据概述:... -
社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411
社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411 数据来源:互联网公开数据 标签:社交媒体,语言识别,数据集,文本分析,机器学习,自然语言处理,情感分析,西班牙语 数据概述:... -
语言检测数据集LanguageDetectionDataset-trinhtung
语言检测数据集LanguageDetectionDataset-trinhtung 数据来源:互联网公开数据 标签:语言检测,自然语言处理,数据集,文本分析,机器学习,人工智能,数据科学,语言学 数据概述: 该数据集包含来自多个来源的文本数据,用于语言检测任务。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。 地理范围:... -
垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab
垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,数据集,机器学习,邮件过滤,文本分析,信息检索 数据概述:该数据集包含来自SpamAssassin项目的邮件数据,用于训练和测试垃圾邮件过滤系统。主要特征如下:... -
多语言翻译标签数据集TagsandTranslationDataset-outlook0
多语言翻译标签数据集TagsandTranslationDataset-outlook0 数据来源:互联网公开数据 标签:多语言翻译,数据集,标签管理,自然语言处理,机器翻译,文本分析,数据科学,信息处理 数据概述: 该数据集包含了来自多个来源的标签及其多语言翻译,适用于标签管理和多语言系统的构建。主要特征如下:... -
巴西高等法院STJ判决书与通行证数据集DiriasePassagensSTJ2025Dataset-matheus121
巴西高等法院STJ判决书与通行证数据集DiriasePassagensSTJ2025Dataset-matheus121 数据来源:互联网公开数据 标签:法律,司法,数据集,判决书,通行证,巴西,STJ,文本分析 数据概述: 该数据集包含了来自巴西高等法院(STJ)的判决书和通行证相关数据,旨在为法律研究和文本分析提供支持。主要特征如下:... -
自然语言处理数据集ANLP概览-ankitmakhija98
自然语言处理数据集ANLP概览-ankitmakhija98 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,NLP,语料库,语言模型,人工智能 数据概述: 该数据集汇总了各种自然语言处理(NLP)数据集,涵盖了文本分类,情感分析,机器翻译,文本生成,问答系统等多种NLP任务。主要特征如下: 时间跨度:... -
阿联酋航空客户评价数据集EmiratesAirlineCustomerReviewsDataset-ahmedelbashir99
阿联酋航空客户评价数据集EmiratesAirlineCustomerReviewsDataset-ahmedelbashir99 数据来源:互联网公开数据 标签:航空业,客户评价,数据集,文本分析,情感分析,机器学习,客户服务,数据挖掘 数据概述:该数据集包含来自阿联酋航空的乘客评价数据,记录了乘客对阿联酋航空服务的反馈和评价。主要特征如下:... -
藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx
藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx 数据来源:互联网公开数据 标签:藏文文献,命名实体识别,数据集,自然语言处理,机器学习,学术研究,文本分析,语言学 数据概述:该数据集包含来自藏文文献的引文数据,用于命名实体识别(NER)任务。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述: 该数据集包含来自维基百科的法语语言内容,记录了多个领域的百科全书条目。主要特征如下:... -
立场检测数据集StanceDetectionDataset-ad6398
立场检测数据集StanceDetectionDataset-ad6398 数据来源:互联网公开数据 标签:立场检测,文本分析,自然语言处理,数据集,情感分析,观点挖掘,机器学习,舆情分析 数据概述: 该数据集包含用于立场检测任务的文本数据,旨在识别文本中对特定目标或主题的立场。主要特征如下:... -
新闻分类数据集NewsCategoryDataset-aishwaryamathala
新闻分类数据集NewsCategoryDataset-aishwaryamathala 数据来源:互联网公开数据 标签:新闻分类,数据集,机器学习,自然语言处理,文本分析,信息检索,媒体研究,文本挖掘 数据概述:该数据集包含来自多个新闻来源的新闻文章,记录了不同类别的新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn
假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn 数据来源:互联网公开数据 标签:假新闻,新闻,文本分析,自然语言处理,机器学习,情感分析,信息检索,文本分类 数据概述: 该数据集来自假新闻挑战赛(Fake News Challenge,FNC-1),旨在促进假新闻的自动检测和识别。主要特征如下:... -
迈阿密商业新冠疫情安全提及数据集MiamiBusinessCOVIDSafetyMentionsDataset-basillabs
迈阿密商业新冠疫情安全提及数据集MiamiBusinessCOVIDSafetyMentionsDataset-basillabs 数据来源:互联网公开数据 标签:商业,新冠疫情,安全措施,提及,数据集,公共卫生,文本分析,健康安全 数据概述:... -
Lacuna分类提交数据集LacunaClassificationSubmissionsDataset-phantom50
Lacuna分类提交数据集LacunaClassificationSubmissionsDataset-phantom50 数据来源:互联网公开数据 标签:分类任务,机器学习,数据集,文本分析,自然语言处理,学术研究,数据科学,人工智能 数据概述: 该数据集包含来自Lacuna平台的分类任务提交数据,记录了用户对文本样本的分类结果。主要特征如下:... -
BBC新闻数据集BBCNewsDataset-waqarahmed163
BBC新闻数据集BBCNewsDataset-waqarahmed163 数据来源:互联网公开数据 标签:BBC新闻,数据集,文本分析,自然语言处理,机器学习,新闻分类,信息提取,文本挖掘 数据概述:该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...