-
路透社27000新闻分类数据集
2025年11月26日 30 56 12
数据集概述 该数据集为路透社新闻分类语料库,原始包含从路透社网站下载的27000篇随机新闻文章,覆盖健康、艺术、政治等8个类别。经去重处理后得到23863篇文档,随机分为14356篇训练集和9507篇测试集,存储标题、正文及所属类别信息。 文件详解 文件名称: Reuters27000/reuters_27000.zip 文件格式: ZIP压缩包...
-
文本主题分类测试数据集TextTopicClassificationTestDataset-redoceanking
2025年4月29日 30 13 3
文本主题分类测试数据集TextTopicClassificationTestDataset-redoceanking 数据来源:互联网公开数据 标签:文本分类, 新闻主题, 自然语言处理, 机器学习, 语料库, Reuters, 文本分析, 情感分析 数据概述:...
-
金融新闻标题情感分析数据集
2025年4月14日 30 80 29
金融新闻标题情感分析数据集 数据来源:互联网公开数据 标签:金融新闻,情感分析,标题,BERT, CNBC, Guardian, Reuters 数据概述:...



