-
垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11
垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11 数据来源:互联网公开数据 标签:垃圾邮件,短信,自然语言处理,文本分类,机器学习,数据集,情感分析,信息安全 数据概述: 该数据集包含来自公开渠道的短信数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了收集数据的时期。... -
尼泊尔新闻文章摘要数据集-adarsh203
尼泊尔新闻文章摘要数据集-adarsh203 数据来源:互联网公开数据 标签:新闻文章,摘要,尼泊尔,自然语言处理,文本分析,机器学习,文本摘要,语料库 数据概述: 该数据集包含了尼泊尔新闻文章及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于文章的发布时间。 地理范围:数据主要涵盖尼泊尔地区的新闻报道。... -
IMDB电影剧情摘要数据集IMDBMoviePlotSummaryDataset-saugatkannojia
IMDB电影剧情摘要数据集IMDBMoviePlotSummaryDataset-saugatkannojia 数据来源:互联网公开数据 标签:电影,剧情分析,数据集,自然语言处理,文本挖掘,情感分析,机器学习,信息检索 数据概述:该数据集包含来自IMDB(互联网电影数据库)的电影剧情摘要数据,记录了数千部电影的剧情简介和相关信息。主要特征如下:... -
地址标准化与纠正小型数据集-hamzanabil
地址标准化与纠正小型数据集-hamzanabil 数据来源:互联网公开数据 标签:地址标准化,数据清洗,文本处理,机器学习,自然语言处理,数据质量,地理信息系统,地址解析 数据概述: 该数据集包含来自公开渠道的地址数据,记录了各种格式的地址信息,旨在用于地址标准化和纠正任务。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的地址信息。... -
轻量级有毒评论数据集ToxicLiteDataset-justinluu
轻量级有毒评论数据集ToxicLiteDataset-justinluu 数据来源:互联网公开数据 标签:文本分析,自然语言处理,情感分析,数据集,机器学习,有毒评论,社交媒体,文本分类 数据概述: 该数据集包含来自社交媒体平台(如Twitter,Reddit等)的评论数据,记录了评论的文本内容及其有毒性标签。主要特征如下:... -
笔记本电脑用户评价情感分析数据集LaptopABSADataset-benkabongo
笔记本电脑用户评价情感分析数据集LaptopABSADataset-benkabongo 数据来源:互联网公开数据 标签:情感分析,用户评价,数据集,自然语言处理,机器学习,文本挖掘,产品评价,计算机科学 数据概述: 该数据集包含来自多个在线购物平台和评论网站的笔记本电脑用户评价数据,记录了用户对笔记本电脑产品的评价内容及其情感倾向。主要特征如下:... -
魔戒电影数据分析数据集LordoftheRingsDataset-jaimeyao
魔戒电影数据分析数据集LordoftheRingsDataset-jaimeyao 数据来源:互联网公开数据 标签:电影,数据分析,魔戒,文化研究,文本分析,人工智能,自然语言处理,影视研究 数据概述: 该数据集包含来自《魔戒》电影系列的数据,记录了该电影系列的详细信息。主要特征如下:... -
情绪方向识别数据集AngerDirectionRecognitionDataset-dianaspahieva
情绪方向识别数据集AngerDirectionRecognitionDataset-dianaspahieva 数据来源:互联网公开数据 标签:情绪识别,数据集,自然语言处理,情感分析,机器学习,人工智能,文本分析,社会研究 数据概述:... -
自然语言到SQL转换数据集NL2SQL-himanshunayal
自然语言到SQL转换数据集NL2SQL-himanshunayal 数据来源:互联网公开数据 标签:自然语言处理,数据库,SQL,数据集,文本理解,语义解析,问答系统,机器学习 数据概述: 该数据集包含1000个样本,用于自然语言到SQL(NL2SQL)任务,即通过自然语言描述来生成SQL查询语句。主要特征如下:... -
推特标签数据集LabelTweetsDataset-corinnedavidemakia
推特标签数据集LabelTweetsDataset-corinnedavidemakia 数据来源:互联网公开数据 标签:推特,社交媒体,文本分析,情感分析,自然语言处理,数据集,机器学习,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的推文数据,并附带标签,用于文本分析和情感分析等任务。主要特征如下:... -
扎罗数学竞赛数据集ZaloMathCompetitionDataset-thnhphong
扎罗数学竞赛数据集ZaloMathCompetitionDataset-thnhphong 数据来源:互联网公开数据 标签:数学竞赛,数据集,机器学习,自然语言处理,数学建模,问题解答,人工智能,文本分析 数据概述: 该数据集包含来自扎罗数学竞赛的题目和解答数据,用于支持数学问题解答,自然语言处理等任务。主要特征如下:... -
实体解析名称与公司数据集EntityResolutionNamevsCompanyDataset-mastmustu
实体解析名称与公司数据集EntityResolutionNamevsCompanyDataset-mastmustu 数据来源:互联网公开数据 标签:实体解析,数据集,企业信息,机器学习,自然语言处理,数据匹配,商业智能,信息整合 数据概述: 该数据集包含来自公开企业信息平台的数据,记录了企业名称与企业实体之间的对应关系。主要特征如下:... -
Jigsaw偏见检测数据集JigsawBiasDetectionDataset-peijinchen
Jigsaw偏见检测数据集JigsawBiasDetectionDataset-peijinchen 数据来源:互联网公开数据 标签:自然语言处理,文本分析,偏见检测,数据集,机器学习,情感分析,社会科学,人工智能 数据概述: 该数据集由 Jigsaw 团队提供,旨在支持对在线评论中偏见和有害言论的检测与分析。主要特征如下:... -
自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta
自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器学习,模型训练,语言模型,情感分析 数据概述: 该数据集包含来自NLP领域的多样化文本数据,旨在支持各种NLP任务,如文本分类,情感分析,机器翻译等。主要特征如下:... -
印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch
印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch 数据来源:互联网公开数据 标签:新闻,印地语,数据集,文本分析,自然语言处理,机器学习,新闻分类,语言处理 数据概述: 该数据集包含来自BBC印地语新闻频道的新闻文章数据,记录了BBC印地语新闻的文本内容。主要特征如下:... -
情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri
情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,BERT模型,机器学习,文本分类,深度学习,人工智能 数据概述: 该数据集专注于情感分析任务,基于BERT-... -
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:... -
土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin
土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin 数据来源:互联网公开数据 标签:科技新闻,数据集,文本分析,自然语言处理,机器学习,信息提取,土耳其,新闻报道... -
披头士乐队歌词数据集TheBeatlesLyricsDataset-yeonseokcho
披头士乐队歌词数据集TheBeatlesLyricsDataset-yeonseokcho 数据来源:互联网公开数据 标签:流行音乐,歌词分析,数据集,音乐研究,文本挖掘,自然语言处理,音乐历史,文化研究 数据概述: 该数据集包含来自披头士乐队(The... -
立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis
立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis 数据来源:互联网公开数据 标签:金融新闻,文本分析,自然语言处理,立陶宛,数据集,情感分析,信息抽取,语言模型 数据概述: 该数据集包含了来自立陶宛金融新闻的文本数据,旨在用于金融领域相关的文本分析任务。主要特征如下: 时间跨度:...