-
黑客新闻2016年9月26日前后评论数据集
黑客新闻2016年9月26日前后评论数据集 数据来源:互联网公开数据 标签:黑客新闻,数据挖掘,时间序列,用户行为,评论分析,新闻分类 数据概述: 本数据集收录了截至2016年9月26日的前12个月内黑客新闻(Hacker... -
-
虚假新闻分类数据集2016-2019
虚假新闻分类数据集2016-2019 数据来源:互联网公开数据 标签:虚假新闻,新闻分类,新闻来源,文本分析,机器学习,数据标注 数据概述:... -
越南卫生新闻数据集2023
越南卫生新闻数据集2023 数据来源:互联网公开数据 标签:越南新闻,卫生,新闻分类,文本生成,情感分析,假新闻检测 数据概述: 本数据集收录了从2023年越南vnexpress.net网站健康类别中爬取的新闻文章,涵盖新闻的URL、标题、关键词、描述、全文内容、文章长度(字数)和作者信息。数据未经过标准化处理,直接反映了网站的原始数据格式。... -
网络欺诈新闻分类数据集
网络欺诈新闻分类数据集 数据来源:互联网公开数据 标签:网络欺诈,新闻分类,金融诈骗,网络安全,数据分析,机器学习,新闻文本 数据概述: 该数据集旨在帮助分类与金融欺诈相关的新闻文章,将其分为网络欺诈(cyber)和非网络欺诈(non-cyber)两类。数据集包含两个CSV文件:cyber.csv 和 noncyber.csv。cyber.csv... -
缅甸新闻分类数据集
缅甸新闻分类数据集 数据来源:互联网公开数据 标签:缅甸新闻,新闻分类,政治,犯罪,健康,国际,社会,商业,环境,体育,劳工,教育与技术,农民 数据概述: 本数据集收录了2019年至2024年间来自DVB(Democratic Voice of... -
金融欺诈与非欺诈相关的新闻分类数据集
金融欺诈与非欺诈相关的新闻分类数据集 数据来源:互联网公开数据 标签:金融欺诈,非欺诈,新闻分类,自然语言处理,金融科技,数据标注 数据概述 本数据集旨在帮助用户对新闻文章进行分类,区分金融欺诈相关和非欺诈相关的内容。由于现有公开数据集中缺乏满足该需求的资源,本数据集由研究团队从头构建,旨在为类似研究提供支持。 数据集包含以下两个CSV文件: 1.... -
在线新闻聚类分析数据集2021
在线新闻聚类分析数据集2021 数据来源:互联网公开数据 标签:在线新闻,聚类分析,K均值聚类,层次聚类,新闻分类,数据挖掘,文本分析 数据概述: 本数据集包含2021年在线新闻的文章数据,涵盖新闻的主题、内容摘要、发布日期、作者、类别等多种信息。数据集旨在为新闻分类和聚类分析提供丰富的源数据,支持不同类型的文本处理研究。 数据用途概述:... -
马拉维新闻分类挑战数据集
马拉维新闻分类挑战数据集 数据来源:互联网公开数据 标签:马拉维,新闻分类,机器学习,数据挑战,自然语言处理,文本分类,社会发展,政治经济,文化环境 数据概述: 本数据集来源于马拉维的主要新闻出版物,由tnyasa Ltd Data Science Lab 收集并整理,涵盖Nation Online报纸、Radio... -
BBC新闻文本分类与主题分析数据集2004-2005
BBC新闻文本分类与主题分析数据集2004-2005 数据来源:互联网公开数据 标签:新闻分类,文本挖掘,自然语言处理,BBC新闻,分类模型,主题分析,语言处理技术 数据概述:... -
BBC印地语新闻文章数据集
BBC印地语新闻文章数据集 数据来源:互联网公开数据 标签:印地语新闻,新闻文本,自然语言处理,NLP,情感分析,语言模型,新闻分类 数据概述: 本数据集包含通过Python网络爬虫技术从BBC印地语新闻网站采集的大量新闻文章,涵盖了多个新闻类别。每个新闻条目包含以下三个核心字段: 标题(Headline):新闻文章的标题,用于概括新闻的主要内容。... -
-
印度及世界新闻推荐系统数据集1892-2020
印度及世界新闻推荐系统数据集1892-2020 数据来源:互联网公开数据 标签:新闻推荐,印度新闻,世界新闻,体育新闻,教育新闻,新闻分类,文本分析 数据概述: 本数据集包含1892年至2020年间与“印度”、“世界新闻”、“体育”和“教育”相关的新闻文章。数据集涵盖了不同领域的重要新闻报道,为新闻推荐系统提供了丰富的文本数据基础。 数据用途概述:... -
列塔-方塔-1000-分词数据集
列塔-方塔-1000-分词数据集 数据来源:互联网公开数据 标签:列塔,方塔,新闻分类,分词处理,文本分析,社会,经济,政治,文化,健康,旅游,科技 数据概述:... -
路透社新闻专线主题数据集
路透社新闻专线主题数据集 数据来源:互联网公开数据 标签:新闻分类,路透社,媒体分析,NLP,新闻趋势,政治,经济,体育,文化,技术 数据概述: 本数据集基于新闻主题分类数据集,旨在用于新闻分类任务,涵盖了新闻文章的各种特征,如文章长度、关键词频率、文章基调和其它分类指标。数据集中的每篇文章都被标记为五个主要新闻类别之一:政治、经济、体育、文化和技术。... -
印度新闻分类与分析数据集2023
印度新闻分类与分析数据集2023 数据来源:互联网公开数据 标签:新闻分类,自然语言处理,印度新闻,文本分析,数据可视化,主题分析,新闻趋势 数据概述:... -
-
荷兰新闻标题数据集
荷兰新闻标题数据集 数据来源:互联网公开数据 标签:新闻标题,荷兰新闻,讽刺检测,新闻分类,政治新闻,国际新闻,国内新闻,自然语言处理,文本分析 数据概述: 本数据集包含来自两个荷兰新闻网站的新闻标题,涵盖正常新闻标题和讽刺性新闻标题。讽刺性标题来源于荷兰网站 Speld.nl(类似于美国的 The Onion),而正常新闻标题则来源于新闻网站...