-
维基百科推广文章数据集
2025年6月1日 30 196 169
维基百科推广文章数据集 数据来源:互联网公开数据 标签:推广文章,维基百科,文本分类,内容分析,数据挖掘,信息质量,自然语言处理 数据概述: 本数据集包含两类文章:一类是被用户标记为“具有推广性语气”的文章(promotional.csv),另一类是被评估为“优质文章”的文章(good.csv)。 - 每篇推广性文章可能带有多个标签,包括但不限于: -... -
维基百科错误纠正数据集WikipediaErrorCorrectionsDataset-neechalkaran
2025年4月25日 30 156 113
维基百科错误纠正数据集WikipediaErrorCorrectionsDataset-neechalkaran 数据来源:互联网公开数据 标签:维基百科,错误纠正,数据集,自然语言处理,文本分析,机器学习,信息质量,数据清洗 数据概述: 该数据集包含来自维基百科的错误纠正数据,记录了维基百科页面中存在的错误及其纠正信息。主要特征如下:...