-
孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan
孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan 数据来源:互联网公开数据 标签:孟加拉语,新闻,文本,自然语言处理,NLP,文本分析,孟加拉国,BD-Pratidin,语料库 数据概述: 本数据集包含了从2017年12月13日至2020年9月9日期间,孟加拉国日报(BD-... -
孟加拉语新闻语料库数据集
孟加拉语新闻语料库数据集 数据来源:互联网公开数据 标签:新闻,孟加拉语,文本分类,语言模型,文本生成,关系抽取,命名实体识别,词性标注 数据概述:... -
俄罗斯Telegram频道文章文本与主题分类数据集
俄罗斯Telegram频道文章文本与主题分类数据集 数据来源:互联网公开数据 标签:Telegram,社交媒体,俄罗斯,文本分析,主题分类,语言学,舆情分析,新闻,政治 数据概述: 本数据集包含了俄罗斯语Telegram频道帖子的标注文本。数据的主要组成部分是帖子的文本内容以及对应的主题分类标签。 数据用途概述:... -
新闻网站地图链接数据分析数据集-BBC-BuzzFeed-CNBC-经济学人-半岛电视台-纽约时报-eliasdabbas
新闻网站地图链接数据分析数据集-BBC-BuzzFeed-CNBC-经济学人-半岛电视台-纽约时报-eliasdabbas 数据来源:互联网公开数据 标签:新闻,网站地图,链接,URL,出版趋势,文本分析,BBC,BuzzFeed,CNBC,经济学人,半岛电视台,纽约时报 数据概述:... -
奥里亚语新闻与维基百科数据集-2021-arnavs19
奥里亚语新闻与维基百科数据集-2021-arnavs19 数据来源:互联网公开数据 标签:奥里亚语,新闻,维基百科,语言模型,情感分析,主题建模,数据集 数据概述: 本数据集包含奥里亚语文本样本,来源包括新闻网站、维基百科和新闻语料库。数据集分为三个主要部分: 奥里亚语新闻文章:收集了19000篇近期奥里亚语新闻文章,涵盖政治、体育、娱乐等多个主题。... -
柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato
柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato 数据来源:互联网公开数据 标签:机器翻译, 柬埔寨语, 英语, 双语语料, 新闻, 文本分析, 自然语言处理, 语言学 数据概述:... -
新闻文本分类预测数据集NewsTextClassificationPrediction-qweasdzxc965
新闻文本分类预测数据集NewsTextClassificationPrediction-qweasdzxc965 数据来源:互联网公开数据 标签:文本分类, 新闻, 标题, 正文, 机器学习, 自然语言处理, 多分类, 预测 数据概述: 该数据集包含来自新闻网站的文章标题和正文内容,旨在用于新闻文本分类任务。主要特征如下:... -
波斯尼亚语新闻文章数据集
波斯尼亚语新闻文章数据集 数据来源:互联网公开数据 标签:波斯尼亚语,新闻,文本分类,情感分析,主题建模,klix.ba,自然语言处理,新闻分析,多语言数据 数据概述:... -
联合国新闻文章数据集UNNewsArticlesDataset-arditobryan
联合国新闻文章数据集UNNewsArticlesDataset-arditobryan 数据来源:互联网公开数据 标签:新闻,联合国,国际关系,政治,数据集,文本分析,自然语言处理,时事 数据概述: 该数据集包含了来自联合国新闻网站的文章数据,记录了联合国及其相关机构发布的各种新闻报道和文章。主要特征如下:... -
新冠疫情新闻真伪辨别数据集COVID-19NewsClaimVerification-totalcrazy
新冠疫情新闻真伪辨别数据集COVID-19NewsClaimVerification-totalcrazy 数据来源:互联网公开数据 标签:疫情, 新冠, 新闻, 真伪辨别, 文本分析, 图像分析, 文本分类, 多模态 数据概述: 该数据集包含来自社交媒体和新闻网站的新冠疫情相关新闻声明及其对应的佐证文档,用于进行新闻真伪辨别任务。主要特征如下:... -
新闻文本分类数据集NewsTextClassification-zhangzheli
新闻文本分类数据集NewsTextClassification-zhangzheli 数据来源:互联网公开数据 标签:文本分类, 新闻, 标题, 正文, 机器学习, 自然语言处理, 多分类, 数据集 数据概述: 该数据集包含来自新闻网站的新闻文章,记录了文章的标题、正文以及所属类别信息,用于新闻文本的分类任务。主要特征如下:... -
新闻故事积极内容分析数据集NewsStoriesPositiveContentAnalysis-vitalychait
新闻故事积极内容分析数据集NewsStoriesPositiveContentAnalysis-vitalychait 数据来源:互联网公开数据 标签:新闻, 积极内容, 文本分析, 情感分析, 故事, 爬虫, 文本挖掘, 自然语言处理 数据概述: 该数据集包含来自Good News... -
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻, 自然语言处理, 深度学习, 语料库, 情感标签, 预训练 数据概述: 该数据集包含来自新闻报道的文本数据,记录了新闻文章的描述信息及其对应的情感类别。主要特征如下:... -
新闻文本分类数据集NewsTextClassificationDataset-kooyee
新闻文本分类数据集NewsTextClassificationDataset-kooyee 数据来源:互联网公开数据 标签:文本分类, 新闻, 机器学习, 自然语言处理, 情感分析, 文本挖掘, 多分类, 数据标注 数据概述: 该数据集包含新闻文本数据,用于训练和评估文本分类模型。主要特征如下: 时间跨度:数据未明确标注时间信息,可视为静态数据集。... -
新闻文本主题分类数据集NewsTextTopicClassification-liliyadav
新闻文本主题分类数据集NewsTextTopicClassification-liliyadav 数据来源:互联网公开数据 标签:文本分类, 新闻, 主题识别, 自然语言处理, 机器学习, 语料库, 文本分析, 情感分析 数据概述: 该数据集包含来自新闻报道的文本内容,记录了不同文章及其对应的主题分类。主要特征如下:... -
多新闻摘要数据集MultiNewsDataset-nguyenvuthanhtung
多新闻摘要数据集MultiNewsDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,新闻,机器学习,信息检索,深度学习,语言模型 数据概述: 该数据集包含来自新闻网站的多个新闻报道及其对应的摘要,旨在用于文本摘要任务。主要特征如下:... -
新闻文本分类数据集-kk0105
新闻文本分类数据集-kk0105 数据来源:互联网公开数据 标签:新闻,文本分类,自然语言处理,机器学习,数据集,情感分析,主题识别,文本分析 数据概述: 该数据集包含了来自不同来源的新闻文本,用于新闻文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于新闻来源,但涵盖了近期的新闻信息。... -
搜狐新闻文本分类标签数据集SohuNewsTextClassificationLabelDataset-lanweixiao
搜狐新闻文本分类标签数据集SohuNewsTextClassificationLabelDataset-lanweixiao 数据来源:互联网公开数据 标签:文本分类, 新闻, 标签, 自然语言处理, 机器学习, 数据标注, 情感分析, 搜狐 数据概述:... -
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-ritchiepulikottil
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-ritchiepulikottil 数据来源:互联网公开数据 标签:新闻, 文本分类, 虚假新闻, 自然语言处理, 机器学习, 标题, 作者, 文本分析, 二元分类 数据概述:... -
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha 数据来源:互联网公开数据 标签:新闻,尼泊尔,数据集,文本分析,自然语言处理,机器学习,信息提取,新闻分类 数据概述: 该数据集包含来自尼泊尔的新闻数据,记录了尼泊尔国内外的新闻报道和新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2014年到2020年。...