-
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai 数据来源:互联网公开数据 标签:命名实体识别,教育领域,数据集,自然语言处理,机器学习,文本分析,学术研究,信息提取 数据概述: 该数据集专注于高等教育领域的文本数据,记录了包含命名实体的文本样本,适用于命名实体识别(NER)任务的训练和评估。主要特征如下:...
-
黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45
黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45 数据来源:互联网公开数据 标签:文本分析,数据提取,自然语言处理,机器学习,数据集,信息提取,文本挖掘,情感分析 数据概述:该数据集包含来自黑科弗公司的数据,专注于文本数据的提取和分析。主要特征如下:...
-
预处理推文数据集PreprocessedTweetsDataset-dv1453
预处理推文数据集PreprocessedTweetsDataset-dv1453 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,机器学习,情感分析,自然语言处理,数据挖掘,信息提取 数据概述: 该数据集包含来自社交媒体平台预处理后的推文数据,记录了用户发布的推文文本及相关信息。主要特征如下:...
-
自然语言处理NLP最终项目数据集-prasadmagdum
自然语言处理NLP最终项目数据集-prasadmagdum 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,情感分析,文本分类,信息提取,深度学习 数据概述: 该数据集是为自然语言处理最终项目设计的,包含了多种文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的来源。...
-
新闻摘要数据集NewsSummaryDataset-usmannwaheed
新闻摘要数据集NewsSummaryDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻,摘要,数据集,文本分析,自然语言处理,机器学习,信息提取,文本生成 数据概述: 该数据集包含来自互联网的新闻文章及其对应的摘要,记录了新闻内容的关键信息。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2017年。...
-
推特新训练集TweetNewTrainFolds-zzy990106
推特新训练集TweetNewTrainFolds-zzy990106 数据来源:互联网公开数据 标签:推特数据,数据集,文本分析,机器学习,自然语言处理,社交媒体分析,情感分析,信息提取 数据概述:该数据集包含来自推特的新训练数据,记录了大量推文以供文本分析和机器学习任务。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
-
网络爬虫数据数据集CrawDataDataset-quynguynminh
网络爬虫数据数据集CrawDataDataset-quynguynminh 数据来源:互联网公开数据 标签:数据采集,网络爬虫,数据集,数据处理,数据挖掘,信息提取,网络技术,大数据 数据概述: 该数据集包含通过网络爬虫技术从互联网公开来源采集的数据,记录了多个网站和平台的信息。主要特征如下: 时间跨度:数据记录的时间范围从最近几年到当前。...
-
新闻文本数据集ScrapedNewsDataDataset-eilhie
新闻文本数据集ScrapedNewsDataDataset-eilhie 数据来源:互联网公开数据 标签:新闻数据,文本分析,数据集,自然语言处理,机器学习,信息提取,数据挖掘,新闻媒体 数据概述: 该数据集包含来自互联网的公开新闻数据,记录了各类新闻文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从【起始年份】到【结束年份】。...
-
BBC新闻数据集BBCNewsDataset-waqarahmed163
BBC新闻数据集BBCNewsDataset-waqarahmed163 数据来源:互联网公开数据 标签:BBC新闻,数据集,文本分析,自然语言处理,机器学习,新闻分类,信息提取,文本挖掘 数据概述:该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
-
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,序列到序列模型,机器学习,文本生成,深度学习,信息提取 数据概述: 该数据集专注于文本摘要生成任务,记录了大量的文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从过去几年到近期。...
-
邮件内容分析数据集MailsDataset-riyahedaoo
邮件内容分析数据集MailsDataset-riyahedaoo 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,机器学习,信息提取,通信研究,商业智能 数据概述: 该数据集包含来自多个邮件系统的邮件内容数据,记录了各类邮件的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2020年。...
-
手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth
手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth 数据来源:互联网公开数据 标签:电子产品,手机,数据集,文本分析,自然语言处理,产品描述,市场研究,信息提取 数据概述: 该数据集包含来自多个电商平台和手机品牌官方网站的手机产品描述数据,记录了各类手机产品的详细信息。主要特征如下:...
-
句子嵌入表示数据集SentenceEmbeddingDataset-dm4006
句子嵌入表示数据集SentenceEmbeddingDataset-dm4006 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,深度学习,语义检索,信息提取,人工智能 数据概述: 该数据集包含大量的句子及其对应的嵌入向量表示,记录了文本数据通过特定算法生成的向量特征。主要特征如下:...
-
BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen
BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen 数据来源:互联网公开数据 标签:新闻分析,自然语言处理,数据集,文本分类,机器学习,信息提取,语言模型,数据挖掘 数据概述: 该数据集包含来自BBC新闻的文本数据,记录了新闻文章的标题,内容,分类标签等信息。主要特征如下:...
-
世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin
世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin 数据来源:互联网公开数据 标签:新闻页面,数据集,文本分析,自然语言处理,全球新闻,媒体研究,信息提取,社会学研究 数据概述:该数据集包含来自土耳其广播电视台TRT Haber的全球新闻页面数据,记录了世界范围内的新闻报道内容。主要特征如下:...
-
COVID-19数值声明开放研究数据集-2020至2022年-dshah1612
COVID-19数值声明开放研究数据集-2020至2022年-dshah1612 数据来源:互联网公开数据 标签:COVID-19,数值声明,学术研究,科学论文,数据集,开放研究,生物医学,可信度,信息提取 数据概述:...
-
罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu
罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,媒体研究,信息提取,机器学习,新闻媒体 数据概述: 该数据集包含罗马尼亚新闻网站的文章数据,记录了特定日期的新闻内容和相关信息。主要特征如下:...
-
新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword
新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,机器学习,自然语言处理,信息提取,舆情分析,媒体研究 数据概述: 该数据集包含来自各大新闻媒体和在线新闻平台的数据,记录了新闻文章,标题,发布时间,来源网站及关键词等信息。主要特征如下:...
-
表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc
表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc 数据来源:互联网公开数据 标签:表格摘要,数据集,自然语言处理,文本挖掘,机器学习,信息提取,知识图谱,人工智能 数据概述: 该数据集包含来自多个来源的表格数据及其对应的文本摘要,记录了表格内容的自动生成文本描述。主要特征如下:...
-
文章主题数据集ArticleTopicDataset-bhavyarajsinhzala
文章主题数据集ArticleTopicDataset-bhavyarajsinhzala 数据来源:互联网公开数据 标签:文本分析,主题分类,数据集,自然语言处理,机器学习,信息提取,内容分析,学术研究 数据概述: 该数据集包含来自互联网公开渠道的文章主题数据,记录了各类文章的主题分类信息。主要特征如下:...



