-
网络爬虫数据数据集CrawDataDataset-quynguynminh
网络爬虫数据数据集CrawDataDataset-quynguynminh 数据来源:互联网公开数据 标签:数据采集,网络爬虫,数据集,数据处理,数据挖掘,信息提取,网络技术,大数据 数据概述: 该数据集包含通过网络爬虫技术从互联网公开来源采集的数据,记录了多个网站和平台的信息。主要特征如下: 时间跨度:数据记录的时间范围从最近几年到当前。...
-
新闻文本数据集ScrapedNewsDataDataset-eilhie
新闻文本数据集ScrapedNewsDataDataset-eilhie 数据来源:互联网公开数据 标签:新闻数据,文本分析,数据集,自然语言处理,机器学习,信息提取,数据挖掘,新闻媒体 数据概述: 该数据集包含来自互联网的公开新闻数据,记录了各类新闻文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从【起始年份】到【结束年份】。...
-
BBC新闻数据集BBCNewsDataset-waqarahmed163
BBC新闻数据集BBCNewsDataset-waqarahmed163 数据来源:互联网公开数据 标签:BBC新闻,数据集,文本分析,自然语言处理,机器学习,新闻分类,信息提取,文本挖掘 数据概述:该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
-
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,序列到序列模型,机器学习,文本生成,深度学习,信息提取 数据概述: 该数据集专注于文本摘要生成任务,记录了大量的文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从过去几年到近期。...
-
邮件内容分析数据集MailsDataset-riyahedaoo
邮件内容分析数据集MailsDataset-riyahedaoo 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,机器学习,信息提取,通信研究,商业智能 数据概述: 该数据集包含来自多个邮件系统的邮件内容数据,记录了各类邮件的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2020年。...
-
手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth
手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth 数据来源:互联网公开数据 标签:电子产品,手机,数据集,文本分析,自然语言处理,产品描述,市场研究,信息提取 数据概述: 该数据集包含来自多个电商平台和手机品牌官方网站的手机产品描述数据,记录了各类手机产品的详细信息。主要特征如下:...
-
句子嵌入表示数据集SentenceEmbeddingDataset-dm4006
句子嵌入表示数据集SentenceEmbeddingDataset-dm4006 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,深度学习,语义检索,信息提取,人工智能 数据概述: 该数据集包含大量的句子及其对应的嵌入向量表示,记录了文本数据通过特定算法生成的向量特征。主要特征如下:...
-
美国国家公共电台新闻数据集NPRNewsDataset-gauravduttakiit
美国国家公共电台新闻数据集NPRNewsDataset-gauravduttakiit 数据来源:互联网公开数据 标签:新闻数据,数据集,自然语言处理,文本分析,机器学习,新闻学,媒体研究,社会研究 数据概述:该数据集包含来自美国国家公共电台(NPR)的新闻数据,记录了NPR发布的新闻文章和广播节目的详细信息。主要特征如下:...
-
BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen
BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen 数据来源:互联网公开数据 标签:新闻分析,自然语言处理,数据集,文本分类,机器学习,信息提取,语言模型,数据挖掘 数据概述: 该数据集包含来自BBC新闻的文本数据,记录了新闻文章的标题,内容,分类标签等信息。主要特征如下:...
-
世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin
世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin 数据来源:互联网公开数据 标签:新闻页面,数据集,文本分析,自然语言处理,全球新闻,媒体研究,信息提取,社会学研究 数据概述:该数据集包含来自土耳其广播电视台TRT Haber的全球新闻页面数据,记录了世界范围内的新闻报道内容。主要特征如下:...
-
COVID-19数值声明开放研究数据集-2020至2022年-dshah1612
COVID-19数值声明开放研究数据集-2020至2022年-dshah1612 数据来源:互联网公开数据 标签:COVID-19,数值声明,学术研究,科学论文,数据集,开放研究,生物医学,可信度,信息提取 数据概述:...
-
罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu
罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,媒体研究,信息提取,机器学习,新闻媒体 数据概述: 该数据集包含罗马尼亚新闻网站的文章数据,记录了特定日期的新闻内容和相关信息。主要特征如下:...
-
新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword
新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,机器学习,自然语言处理,信息提取,舆情分析,媒体研究 数据概述: 该数据集包含来自各大新闻媒体和在线新闻平台的数据,记录了新闻文章,标题,发布时间,来源网站及关键词等信息。主要特征如下:...
-
表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc
表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc 数据来源:互联网公开数据 标签:表格摘要,数据集,自然语言处理,文本挖掘,机器学习,信息提取,知识图谱,人工智能 数据概述: 该数据集包含来自多个来源的表格数据及其对应的文本摘要,记录了表格内容的自动生成文本描述。主要特征如下:...
-
文章主题数据集ArticleTopicDataset-bhavyarajsinhzala
文章主题数据集ArticleTopicDataset-bhavyarajsinhzala 数据来源:互联网公开数据 标签:文本分析,主题分类,数据集,自然语言处理,机器学习,信息提取,内容分析,学术研究 数据概述: 该数据集包含来自互联网公开渠道的文章主题数据,记录了各类文章的主题分类信息。主要特征如下:...
-
网页挖掘与数据分析数据集DataProjectWebMining2024-1Dataset-shao2011
网页挖掘与数据分析数据集DataProjectWebMining2024-1Dataset-shao2011 数据来源:互联网公开数据 标签:网页挖掘,数据采集,数据集,网络分析,机器学习,信息提取,数据科学,大数据 数据概述: 该数据集来自2024年网页挖掘项目,记录了从互联网上采集的各种网页数据。主要特征如下:...
-
推特灾难文本分析数据集-bharathsj
推特灾难文本分析数据集-bharathsj 数据来源:互联网公开数据 标签:推特数据,灾难事件,文本分析,自然语言处理,情感分析,信息提取,机器学习,社会科学 数据概述: 该数据集包含来自推特(Twitter)的文本数据,记录了与灾难事件相关的推文内容。主要特征如下: 时间跨度: 数据记录的时间范围根据数据集具体情况而定,通常涵盖特定灾难事件发生前后。...
-
音频头信息数据集AudioHeaderInformationDataset-parsaaskari
音频头信息数据集AudioHeaderInformationDataset-parsaaskari 数据来源:互联网公开数据 标签:音频处理,数据集,元数据,多媒体,信号处理,数据解析,音频分析,信息提取 数据概述: 该数据集包含来自公开音频文件的头部信息数据,记录了音频文件的元数据特征。主要特征如下: 时间跨度:...
-
地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr
地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,位置识别,机器学习,信息提取,地理信息系统,命名实体识别 数据概述: 该数据集由Zindi平台提供,专注于识别文本中提及的地理位置信息。主要特征如下:...
-
性别检测数据集GenderDetectionDataset-subhajournal
性别检测数据集GenderDetectionDataset-subhajournal 数据来源:互联网公开数据 标签:性别检测,数据集,自然语言处理,机器学习,文本分析,文本分类,社会研究,信息提取 数据概述:该数据集包含来自互联网的公开数据,记录了不同用户在社交媒体上的用户名,昵称和相关文本信息,适用于性别检测和分类任务。主要特征如下:...



