-
BBC新闻文本分类与主题分析数据集2004-2005
BBC新闻文本分类与主题分析数据集2004-2005 数据来源:互联网公开数据 标签:新闻分类,文本挖掘,自然语言处理,BBC新闻,分类模型,主题分析,语言处理技术 数据概述:...
-
BBC印地语新闻文章数据集
BBC印地语新闻文章数据集 数据来源:互联网公开数据 标签:印地语新闻,新闻文本,自然语言处理,NLP,情感分析,语言模型,新闻分类 数据概述: 本数据集包含通过Python网络爬虫技术从BBC印地语新闻网站采集的大量新闻文章,涵盖了多个新闻类别。每个新闻条目包含以下三个核心字段: 标题(Headline):新闻文章的标题,用于概括新闻的主要内容。...
-
BBC新闻数据集-2226
BBC新闻数据集-2226 数据来源:互联网公开数据 标签:BBC新闻,自然语言处理,NLP,文本分类,新闻标签,2004-2005,商业,娱乐,政治,体育,科技 数据概述:...
-
-
印度及世界新闻推荐系统数据集1892-2020
印度及世界新闻推荐系统数据集1892-2020 数据来源:互联网公开数据 标签:新闻推荐,印度新闻,世界新闻,体育新闻,教育新闻,新闻分类,文本分析 数据概述: 本数据集包含1892年至2020年间与“印度”、“世界新闻”、“体育”和“教育”相关的新闻文章。数据集涵盖了不同领域的重要新闻报道,为新闻推荐系统提供了丰富的文本数据基础。 数据用途概述:...
-
列塔-方塔-1000-分词数据集
列塔-方塔-1000-分词数据集 数据来源:互联网公开数据 标签:列塔,方塔,新闻分类,分词处理,文本分析,社会,经济,政治,文化,健康,旅游,科技 数据概述:...
-
英国广播公司BBC新闻文章分类数据集
英国广播公司BBC新闻文章分类数据集 数据来源:互联网公开数据 标签:新闻文章,BBC,文本分类,自然语言处理,新闻聚合,舆情分析,文本挖掘,新闻类别 数据概述:...
-
路透社新闻专线主题数据集
路透社新闻专线主题数据集 数据来源:互联网公开数据 标签:新闻分类,路透社,媒体分析,NLP,新闻趋势,政治,经济,体育,文化,技术 数据概述: 本数据集基于新闻主题分类数据集,旨在用于新闻分类任务,涵盖了新闻文章的各种特征,如文章长度、关键词频率、文章基调和其它分类指标。数据集中的每篇文章都被标记为五个主要新闻类别之一:政治、经济、体育、文化和技术。...
-
印度新闻分类与分析数据集2023
印度新闻分类与分析数据集2023 数据来源:互联网公开数据 标签:新闻分类,自然语言处理,印度新闻,文本分析,数据可视化,主题分析,新闻趋势 数据概述:...
-
-
荷兰新闻标题数据集
荷兰新闻标题数据集 数据来源:互联网公开数据 标签:新闻标题,荷兰新闻,讽刺检测,新闻分类,政治新闻,国际新闻,国内新闻,自然语言处理,文本分析 数据概述: 本数据集包含来自两个荷兰新闻网站的新闻标题,涵盖正常新闻标题和讽刺性新闻标题。讽刺性标题来源于荷兰网站 Speld.nl(类似于美国的 The Onion),而正常新闻标题则来源于新闻网站...
-
洋葱新闻数据集
洋葱新闻数据集 数据来源:互联网公开数据 标签:洋葱新闻,真实新闻,文本分类,机器学习,自然语言处理,数据集,新闻真实性 数据概述: 本数据集包含《The Onion》发布的假新闻文章和来自Reddit论坛r/NotTheOnion的真实“洋葱式”新闻文章。《The...
-
阿拉伯新闻分类研究数据集1963-2021
阿拉伯新闻分类研究数据集1963-2021 数据来源:互联网公开数据 标签:阿拉伯新闻,分类研究,NLP,创业,科技,其他,灵感 数据概述:...



