-
互联网公开新闻数据集
2025年4月8日 123 26 5
标题:互联网公开新闻数据集 数据内容: 该数据集包含从互联网公开数据中收集的新闻文章信息。具体包含以下数据元素: - id:唯一标识符,共有13368种不同的值 - article:完整的新闻文章文本 - highlights:文章的摘要或重点内容,共有13300种不同的值 数据来源: 互联网公开数据 数据用途: 该数据集可以用于多个行业的多种问题:... -
大规模文本分类数据集详述
2025年4月22日 62 15 2
标题:大规模文本分类数据集详述 数据内容:该数据集包含了三个主要的数据元素,分别是评论内容(clean_comment)、文本内容(clean_text)和分类标签(category)。其中,评论内容有36,801种不同的值,文本内容有162,977种不同的值,分类标签有3种不同的值。数据集整体规模较大,适合用于文本分类、情感分析等任务。...