-
互联网公开新闻数据集
标题:互联网公开新闻数据集 数据内容: 该数据集包含从互联网公开数据中收集的新闻文章信息。具体包含以下数据元素: - id:唯一标识符,共有13368种不同的值 - article:完整的新闻文章文本 - highlights:文章的摘要或重点内容,共有13300种不同的值 数据来源: 互联网公开数据 数据用途: 该数据集可以用于多个行业的多种问题:... -
-
CNN新闻文章数据集
CNN新闻文章数据集 数据来源:互联网公开数据 标签:新闻媒体,CNN,文本分析,数据清洗,新闻分类,自然语言处理,NLP,新闻内容,新闻主题 数据概述:... -
新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain
新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain 数据来源:互联网公开数据 标签:新闻分类,文本分析,数据集,自然语言处理,机器学习,信息检索,数据挖掘,人工智能 数据概述: 该数据集包含来自Draup平台的新闻文本数据,主要记录了各类新闻文章的文本内容及其分类标签。主要特征如下:... -
新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha
新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,数据挖掘,信息检索,媒体研究 数据概述: 该数据集包含来自公开新闻来源的清洗后数据,记录了各类新闻文章的详细分类信息。主要特征如下:... -
印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch
印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch 数据来源:互联网公开数据 标签:新闻,印地语,数据集,文本分析,自然语言处理,机器学习,新闻分类,语言处理 数据概述: 该数据集包含来自BBC印地语新闻频道的新闻文章数据,记录了BBC印地语新闻的文本内容。主要特征如下:... -
新闻杂志分类数据集NewsMagazineClassifierDataset-rushikeshhiray
新闻杂志分类数据集NewsMagazineClassifierDataset-rushikeshhiray 数据来源:互联网公开数据 标签:新闻分类,数据集,文本挖掘,自然语言处理,机器学习,新闻媒体,信息检索,文本分析 数据概述: 该数据集包含来自多个新闻和杂志来源的文章数据,记录了不同类别新闻和杂志文章的内容信息。主要特征如下:... -
-
BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran
BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,自然语言处理,机器学习,数据挖掘,信息检索,人工智能 数据概述:该数据集包含来自BBC(英国广播公司)的新闻文章,主要用于新闻类别的自动分类。主要特征如下:... -
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,自然语言处理,机器学习,媒体研究,新闻分类,语言模型 数据概述: 该数据集包含来自孟加拉国新闻媒体的新闻标题数据,记录了新闻标题的文本内容。主要特征如下:... -
新闻分类与情感检测数据集NewsClassificationandEmotionDetectionDataset-razamukhtar007
新闻分类与情感检测数据集NewsClassificationandEmotionDetectionDataset-razamukhtar007 数据来源:互联网公开数据 标签:新闻分类,情感检测,数据集,自然语言处理,机器学习,文本分析,情感识别,信息提取... -
泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit
泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,泰米尔语,数据集,自然语言处理,文本分析,机器学习,信息检索,语言技术 数据概述: 该数据集包含来自泰米尔语新闻媒体的数据,记录了不同类别的泰米尔语新闻文章。主要特征如下:... -
-
新闻标签生成与人工评估数据集NewsTagsGenerationandHumanEvaluationDataset-nonyakangwanteerawat
新闻标签生成与人工评估数据集NewsTagsGenerationandHumanEvaluationDataset-nonyakangwanteerawat 数据来源:互联网公开数据 标签:新闻分析,标签生成,数据集,自然语言处理,文本挖掘,机器学习,新闻分类,人工智能 数据概述:... -
俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina
俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息检索,语言技术,俄语处理 数据概述:... -
阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals
阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals 数据来源:互联网公开数据 标签:阿拉伯语,新闻数据,数据集,自然语言处理,文本分析,机器学习,新闻分类,语言资源 数据概述: 该数据集包含来自沙特阿拉伯Sabq新闻网站的文章数据,记录了网站发布的阿拉伯语新闻报道。主要特征如下:... -
阿拉伯语新闻分类数据集-essasartawi
阿拉伯语新闻分类数据集-essasartawi 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,阿拉伯语处理,信息检索,文本挖掘 数据概述:该数据集包含来自阿拉伯语新闻媒体的新闻文章,旨在用于新闻分类任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
数据2019年至今财经新闻带标签数据集FinancialNewswithLabelssince2019Dataset-cy00cy
2019年至今财经新闻带标签数据集FinancialNewswithLabelssince2019Dataset-cy00cy 数据来源:互联网公开数据 标签:财经新闻,文本分析,数据集,情感分析,机器学习,自然语言处理,新闻分类,时间序列 数据概述:... -
假新闻与真实新闻分类数据集-2021
假新闻与真实新闻分类数据集-2021 数据来源:互联网公开数据 标签:假新闻,真实新闻,文本分析,TF-IDF,机器学习,新闻分类,数据标注 数据概述: 本数据集包含标记为假新闻和真实新闻的新闻文章。数据集来源于互联网公开数据,旨在用于假新闻识别的研究和应用。数据集包含三个关键字段: - Title:新闻标题 - Text:新闻正文或内容 -... -
孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70
孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,语言处理,孟加拉语,分类算法 数据概述: 该数据集包含来自孟加拉语新闻网站的数据,记录了各类新闻文章的文本内容和分类标签。主要特征如下:...