-
US新闻分类与推荐数据集
US新闻分类与推荐数据集 数据来源:互联网公开数据 标签:新闻分类,推荐系统,用户点击行为,文本分析,深度学习模型 数据概述: 本数据集包含两个文件:user_news_clicks.csv 和 news_text.csv,用于支持新闻分类和推荐系统的开发与研究。news_text.csv...
-
多主题分类新闻文章数据集1963-2021
多主题分类新闻文章数据集1963-2021 数据来源:互联网公开数据 标签:主题分类,新闻,文章,评论,情感分析,健康,金融,体育,科学,政治,NLP处理,文本清理,POS标注,词形还原 数据概述:...
-
-
土耳其新闻70000数据集
土耳其新闻70000数据集 数据来源:互联网公开数据 标签:土耳其新闻,新闻分类,文本数据,机器学习,自然语言处理,媒体分析,信息抽取 数据概述:...
-
斯瓦希里语新闻分类数据集
斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:...
-
全球议题新闻分类数据集
全球议题新闻分类数据集 数据来源:互联网公开数据 标签:新闻分类,全球议题,文本分类,多分类问题,不平衡数据,动态更新,机器学习基准数据集 数据概述...
-
新闻组文章分类数据集1990-2000
新闻组文章分类数据集1990-2000 数据来源:互联网公开数据 标签:新闻组,文本分类,文本预处理,文本聚类,主题挖掘,主题分类,自然语言处理 数据概述:...
-
阿拉伯语新闻文本分类语料库
阿拉伯语新闻文本分类语料库 数据来源:互联网公开数据 标签:阿拉伯语,新闻,文本分类,自然语言处理,机器学习,语料库 数据概述: 本数据集包含以阿拉伯语撰写的新闻文本,涵盖了9个不同的新闻类别,以CSV格式存储。数据集旨在为阿拉伯语新闻文本的分类任务提供支持,包含数万条新闻数据,每条数据均标注了具体的类别信息。 数据用途概述:...
-
坦桑尼亚斯瓦希里语新闻分类数据集
坦桑尼亚斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,坦桑尼亚,语言处理,数据竞赛,文本分析,媒体研究 数据概述:...
-
英国广播公司BBC新闻文章文本分类数据集
英国广播公司BBC新闻文章文本分类数据集 数据来源:互联网公开数据 标签:新闻文章,文本分类,自然语言处理,机器学习,BBC,媒体,文本数据,分类任务 数据概述:...
-
黑客新闻2016年9月26日前后评论数据集
黑客新闻2016年9月26日前后评论数据集 数据来源:互联网公开数据 标签:黑客新闻,数据挖掘,时间序列,用户行为,评论分析,新闻分类 数据概述: 本数据集收录了截至2016年9月26日的前12个月内黑客新闻(Hacker...
-
-
虚假新闻分类数据集2016-2019
虚假新闻分类数据集2016-2019 数据来源:互联网公开数据 标签:虚假新闻,新闻分类,新闻来源,文本分析,机器学习,数据标注 数据概述:...
-
越南卫生新闻数据集2023
越南卫生新闻数据集2023 数据来源:互联网公开数据 标签:越南新闻,卫生,新闻分类,文本生成,情感分析,假新闻检测 数据概述: 本数据集收录了从2023年越南vnexpress.net网站健康类别中爬取的新闻文章,涵盖新闻的URL、标题、关键词、描述、全文内容、文章长度(字数)和作者信息。数据未经过标准化处理,直接反映了网站的原始数据格式。...
-
网络欺诈新闻分类数据集
网络欺诈新闻分类数据集 数据来源:互联网公开数据 标签:网络欺诈,新闻分类,金融诈骗,网络安全,数据分析,机器学习,新闻文本 数据概述: 该数据集旨在帮助分类与金融欺诈相关的新闻文章,将其分为网络欺诈(cyber)和非网络欺诈(non-cyber)两类。数据集包含两个CSV文件:cyber.csv 和 noncyber.csv。cyber.csv...
-
缅甸新闻分类数据集
缅甸新闻分类数据集 数据来源:互联网公开数据 标签:缅甸新闻,新闻分类,政治,犯罪,健康,国际,社会,商业,环境,体育,劳工,教育与技术,农民 数据概述: 本数据集收录了2019年至2024年间来自DVB(Democratic Voice of...
-
金融欺诈与非欺诈相关的新闻分类数据集
金融欺诈与非欺诈相关的新闻分类数据集 数据来源:互联网公开数据 标签:金融欺诈,非欺诈,新闻分类,自然语言处理,金融科技,数据标注 数据概述 本数据集旨在帮助用户对新闻文章进行分类,区分金融欺诈相关和非欺诈相关的内容。由于现有公开数据集中缺乏满足该需求的资源,本数据集由研究团队从头构建,旨在为类似研究提供支持。 数据集包含以下两个CSV文件: 1....
-
在线新闻聚类分析数据集2021
在线新闻聚类分析数据集2021 数据来源:互联网公开数据 标签:在线新闻,聚类分析,K均值聚类,层次聚类,新闻分类,数据挖掘,文本分析 数据概述: 本数据集包含2021年在线新闻的文章数据,涵盖新闻的主题、内容摘要、发布日期、作者、类别等多种信息。数据集旨在为新闻分类和聚类分析提供丰富的源数据,支持不同类型的文本处理研究。 数据用途概述:...
-
-
马拉维新闻分类挑战数据集
马拉维新闻分类挑战数据集 数据来源:互联网公开数据 标签:马拉维,新闻分类,机器学习,数据挑战,自然语言处理,文本分类,社会发展,政治经济,文化环境 数据概述: 本数据集来源于马拉维的主要新闻出版物,由tnyasa Ltd Data Science Lab 收集并整理,涵盖Nation Online报纸、Radio...



