-
世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin
世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin 数据来源:互联网公开数据 标签:新闻页面,数据集,文本分析,自然语言处理,全球新闻,媒体研究,信息提取,社会学研究 数据概述:该数据集包含来自土耳其广播电视台TRT Haber的全球新闻页面数据,记录了世界范围内的新闻报道内容。主要特征如下:... -
COVID-19数值声明开放研究数据集-2020至2022年-dshah1612
COVID-19数值声明开放研究数据集-2020至2022年-dshah1612 数据来源:互联网公开数据 标签:COVID-19,数值声明,学术研究,科学论文,数据集,开放研究,生物医学,可信度,信息提取 数据概述:... -
罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu
罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,媒体研究,信息提取,机器学习,新闻媒体 数据概述: 该数据集包含罗马尼亚新闻网站的文章数据,记录了特定日期的新闻内容和相关信息。主要特征如下:... -
新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword
新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,机器学习,自然语言处理,信息提取,舆情分析,媒体研究 数据概述: 该数据集包含来自各大新闻媒体和在线新闻平台的数据,记录了新闻文章,标题,发布时间,来源网站及关键词等信息。主要特征如下:... -
表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc
表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc 数据来源:互联网公开数据 标签:表格摘要,数据集,自然语言处理,文本挖掘,机器学习,信息提取,知识图谱,人工智能 数据概述: 该数据集包含来自多个来源的表格数据及其对应的文本摘要,记录了表格内容的自动生成文本描述。主要特征如下:... -
文章主题数据集ArticleTopicDataset-bhavyarajsinhzala
文章主题数据集ArticleTopicDataset-bhavyarajsinhzala 数据来源:互联网公开数据 标签:文本分析,主题分类,数据集,自然语言处理,机器学习,信息提取,内容分析,学术研究 数据概述: 该数据集包含来自互联网公开渠道的文章主题数据,记录了各类文章的主题分类信息。主要特征如下:... -
网页挖掘与数据分析数据集DataProjectWebMining2024-1Dataset-shao2011
网页挖掘与数据分析数据集DataProjectWebMining2024-1Dataset-shao2011 数据来源:互联网公开数据 标签:网页挖掘,数据采集,数据集,网络分析,机器学习,信息提取,数据科学,大数据 数据概述: 该数据集来自2024年网页挖掘项目,记录了从互联网上采集的各种网页数据。主要特征如下:... -
推特灾难文本分析数据集-bharathsj
推特灾难文本分析数据集-bharathsj 数据来源:互联网公开数据 标签:推特数据,灾难事件,文本分析,自然语言处理,情感分析,信息提取,机器学习,社会科学 数据概述: 该数据集包含来自推特(Twitter)的文本数据,记录了与灾难事件相关的推文内容。主要特征如下: 时间跨度: 数据记录的时间范围根据数据集具体情况而定,通常涵盖特定灾难事件发生前后。... -
音频头信息数据集AudioHeaderInformationDataset-parsaaskari
音频头信息数据集AudioHeaderInformationDataset-parsaaskari 数据来源:互联网公开数据 标签:音频处理,数据集,元数据,多媒体,信号处理,数据解析,音频分析,信息提取 数据概述: 该数据集包含来自公开音频文件的头部信息数据,记录了音频文件的元数据特征。主要特征如下: 时间跨度:... -
地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr
地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,位置识别,机器学习,信息提取,地理信息系统,命名实体识别 数据概述: 该数据集由Zindi平台提供,专注于识别文本中提及的地理位置信息。主要特征如下:... -
性别检测数据集GenderDetectionDataset-subhajournal
性别检测数据集GenderDetectionDataset-subhajournal 数据来源:互联网公开数据 标签:性别检测,数据集,自然语言处理,机器学习,文本分析,文本分类,社会研究,信息提取 数据概述:该数据集包含来自互联网的公开数据,记录了不同用户在社交媒体上的用户名,昵称和相关文本信息,适用于性别检测和分类任务。主要特征如下:... -
FAST-NU院校指南信息提取数据集-ahmedembedded
FAST-NU院校指南信息提取数据集-ahmedembedded 数据来源:互联网公开数据 标签:FAST-NU,院校指南,OCR技术,学术项目,录取标准,课程详情,教育研究,数据科学,机器学习,信息提取 数据概述: 本数据集包含从FAST-NU(巴基斯坦国家科学技术大学基金会)院校指南中提取的文本数据,利用Tesseract... -
BBC新闻自然语言处理与词云数据集BBCNewsNLPandWordcloudDataset-esrabicakci
BBC新闻自然语言处理与词云数据集BBCNewsNLPandWordcloudDataset-esrabicakci 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,词云,文本分析,信息提取,新闻研究,学术资源... -
黄金摘要数据集GoldenSummaryDataset-nguyennguyentrung
黄金摘要数据集GoldenSummaryDataset-nguyennguyentrung 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,文本分析,信息提取,人工智能,数据挖掘 数据概述: 该数据集包含来自多个来源的文本摘要数据,记录了原始文本及其对应的摘要信息。主要特征如下:... -
命名实体识别数据集NamedEntityRecognitionDataset-muhammadabubakar627
命名实体识别数据集NamedEntityRecognitionDataset-muhammadabubakar627 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,信息提取,人工智能,语言学 数据概述: 该数据集包含来自互联网和公开文本资源的标注数据,记录了各种文本中的命名实体。主要特征如下: 时间跨度:... -
基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan
基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan 数据来源:互联网公开数据 标签:新闻,语言模型,数据集,自然语言处理,机器学习,文本分析,信息提取,非洲研究 数据概述:该数据集包含来自赞比亚基特韦地区新闻媒体的文本数据,记录了该地区最新的新闻报道和事件。主要特征如下:... -
新闻标题预测数据集HeadlinePredictionDataset-bohraboxer
新闻标题预测数据集HeadlinePredictionDataset-bohraboxer 数据来源:互联网公开数据 标签:新闻媒体,文本分析,数据集,机器学习,自然语言处理,预测模型,信息提取,深度学习 数据概述: 该数据集记录了来自新闻媒体平台的新闻标题及相关文本数据,主要包含新闻标题,正文片段,发布时间等特征。主要特征如下:... -
网页抓取新闻数据集WebScrapedNewsDataset-ewuraamaasorassiamah
网页抓取新闻数据集WebScrapedNewsDataset-ewuraamaasorassiamah 数据来源:互联网公开数据 标签:新闻数据,网页抓取,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述:该数据集包含通过网页抓取技术收集的新闻数据,记录了来自多个新闻网站的新闻文章。主要特征如下:... -
网页抓取数据集WebScrapingDataset-prabhuingole
网页抓取数据集WebScrapingDataset-prabhuingole 数据来源:互联网公开数据 标签:数据采集,网页抓取,数据集,网络爬虫,数据挖掘,SEO,信息提取,大数据 数据概述: 该数据集通过网页抓取技术从互联网公开来源收集数据,记录了多个网站的内容信息。主要特征如下:... -
新闻分类数据集NewsCategoryDataset-tanmaypatil3151
新闻分类数据集NewsCategoryDataset-tanmaypatil3151 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息提取,分类算法,数据挖掘 数据概述: 该数据集包含来自互联网的新闻文章数据,记录了新闻文章的标题,描述,类别等信息。主要特征如下:...