-
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:... -
地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan
地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan 数据来源:互联网公开数据 标签:地理信息,地名识别,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息提取 数据概述: 该数据集包含来自网络文本和地理信息资源的地名数据,记录了不同文本中的地名及其位置信息。主要特征如下: 时间跨度:... -
最终内容数据集FinalContentDataset-akash1vishwakarma
最终内容数据集FinalContentDataset-akash1vishwakarma 数据来源:互联网公开数据 标签:内容分析,数据集,文本挖掘,自然语言处理,机器学习,数据分析,信息提取,知识管理 数据概述:该数据集包含来自多个来源的内容数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
丹特里新闻网站数据采集数据集DataCrawlDantriSplittedDataset-ngh19m
丹特里新闻网站数据采集数据集DataCrawlDantriSplittedDataset-ngh19m 数据来源:互联网公开数据 标签:新闻数据,数据采集,数据集,文本分析,自然语言处理,机器学习,信息提取,数据挖掘 数据概述: 该数据集包含来自越南丹特里新闻网站(Dantri)的数据,记录了该网站的新闻文章内容。主要特征如下:... -
灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh
灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh 数据来源:互联网公开数据 标签:灾害管理,社交网络,数据集,文本分析,机器学习,自然语言处理,危机响应,信息提取 数据概述:该数据集包含预处理过的推文数据,这些推文与自然灾害事件相关。主要特征如下:... -
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai 数据来源:互联网公开数据 标签:命名实体识别,教育领域,数据集,自然语言处理,机器学习,文本分析,学术研究,信息提取 数据概述: 该数据集专注于高等教育领域的文本数据,记录了包含命名实体的文本样本,适用于命名实体识别(NER)任务的训练和评估。主要特征如下:... -
黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45
黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45 数据来源:互联网公开数据 标签:文本分析,数据提取,自然语言处理,机器学习,数据集,信息提取,文本挖掘,情感分析 数据概述:该数据集包含来自黑科弗公司的数据,专注于文本数据的提取和分析。主要特征如下:... -
预处理推文数据集PreprocessedTweetsDataset-dv1453
预处理推文数据集PreprocessedTweetsDataset-dv1453 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,机器学习,情感分析,自然语言处理,数据挖掘,信息提取 数据概述: 该数据集包含来自社交媒体平台预处理后的推文数据,记录了用户发布的推文文本及相关信息。主要特征如下:... -
自然语言处理NLP最终项目数据集-prasadmagdum
自然语言处理NLP最终项目数据集-prasadmagdum 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,情感分析,文本分类,信息提取,深度学习 数据概述: 该数据集是为自然语言处理最终项目设计的,包含了多种文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的来源。... -
新闻摘要数据集NewsSummaryDataset-usmannwaheed
新闻摘要数据集NewsSummaryDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻,摘要,数据集,文本分析,自然语言处理,机器学习,信息提取,文本生成 数据概述: 该数据集包含来自互联网的新闻文章及其对应的摘要,记录了新闻内容的关键信息。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2017年。... -
推特新训练集TweetNewTrainFolds-zzy990106
推特新训练集TweetNewTrainFolds-zzy990106 数据来源:互联网公开数据 标签:推特数据,数据集,文本分析,机器学习,自然语言处理,社交媒体分析,情感分析,信息提取 数据概述:该数据集包含来自推特的新训练数据,记录了大量推文以供文本分析和机器学习任务。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
网络爬虫数据数据集CrawDataDataset-quynguynminh
网络爬虫数据数据集CrawDataDataset-quynguynminh 数据来源:互联网公开数据 标签:数据采集,网络爬虫,数据集,数据处理,数据挖掘,信息提取,网络技术,大数据 数据概述: 该数据集包含通过网络爬虫技术从互联网公开来源采集的数据,记录了多个网站和平台的信息。主要特征如下: 时间跨度:数据记录的时间范围从最近几年到当前。... -
新闻文本数据集ScrapedNewsDataDataset-eilhie
新闻文本数据集ScrapedNewsDataDataset-eilhie 数据来源:互联网公开数据 标签:新闻数据,文本分析,数据集,自然语言处理,机器学习,信息提取,数据挖掘,新闻媒体 数据概述: 该数据集包含来自互联网的公开新闻数据,记录了各类新闻文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从【起始年份】到【结束年份】。... -
BBC新闻数据集BBCNewsDataset-waqarahmed163
BBC新闻数据集BBCNewsDataset-waqarahmed163 数据来源:互联网公开数据 标签:BBC新闻,数据集,文本分析,自然语言处理,机器学习,新闻分类,信息提取,文本挖掘 数据概述:该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。... -
文本摘要生成训练数据集Summaries-TrainTextSummarizationDataset-samruddhimore
文本摘要生成训练数据集Summaries-TrainTextSummarizationDataset-samruddhimore 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,文本生成,深度学习,信息提取,人工智能 数据概述: 该数据集包含了用于训练文本摘要生成模型的文本数据,主要记录了原始文本及其对应的摘要。主要特征如下:... -
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,序列到序列模型,机器学习,文本生成,深度学习,信息提取 数据概述: 该数据集专注于文本摘要生成任务,记录了大量的文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从过去几年到近期。... -
邮件内容分析数据集MailsDataset-riyahedaoo
邮件内容分析数据集MailsDataset-riyahedaoo 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,机器学习,信息提取,通信研究,商业智能 数据概述: 该数据集包含来自多个邮件系统的邮件内容数据,记录了各类邮件的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2020年。... -
手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth
手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth 数据来源:互联网公开数据 标签:电子产品,手机,数据集,文本分析,自然语言处理,产品描述,市场研究,信息提取 数据概述: 该数据集包含来自多个电商平台和手机品牌官方网站的手机产品描述数据,记录了各类手机产品的详细信息。主要特征如下:... -
句子嵌入表示数据集SentenceEmbeddingDataset-dm4006
句子嵌入表示数据集SentenceEmbeddingDataset-dm4006 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,深度学习,语义检索,信息提取,人工智能 数据概述: 该数据集包含大量的句子及其对应的嵌入向量表示,记录了文本数据通过特定算法生成的向量特征。主要特征如下:... -
BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen
BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen 数据来源:互联网公开数据 标签:新闻分析,自然语言处理,数据集,文本分类,机器学习,信息提取,语言模型,数据挖掘 数据概述: 该数据集包含来自BBC新闻的文本数据,记录了新闻文章的标题,内容,分类标签等信息。主要特征如下:...