-
Webis_Based_Wikipedia科技创新历史数据_2023
2026年1月23日 30 171 74
数据集概述 本数据集包含从2022年1月1日维基媒体数据转储中提取的维基百科科学和技术类文章的历史部分,通过维基百科分类网络检索文章,结合基于章节标题的启发式方法和分类器提取历史章节,形成一个JSON文件。 文件详解 文件名称:webis-WikiSciTech-23.json 文件格式:JSON...
-
Quality_Evaluation_Models_Based_开源软件质量评估分类研究文档完整数据
2025年12月6日 30 8 7
数据集概述 本数据集是一份系统性文献综述的配套文档,用于明确《开源软件质量评估模型或框架:系统性文献综述》研究中,各原始研究(Primary Study)如何对应研究问题(RQs)进行分类。 文件详解 文件名称: Quality Evaluation Models or Frameworks for Open Source Software-A...
-
维基百科推广文章数据集
2025年6月1日 30 165 159
维基百科推广文章数据集 数据来源:互联网公开数据 标签:推广文章,维基百科,文本分类,内容分析,数据挖掘,信息质量,自然语言处理 数据概述: 本数据集包含两类文章:一类是被用户标记为“具有推广性语气”的文章(promotional.csv),另一类是被评估为“优质文章”的文章(good.csv)。 - 每篇推广性文章可能带有多个标签,包括但不限于: -...
-
越南劳动报新闻文章数据集-2022年5月19日
2025年5月31日 30 134 33
越南劳动报新闻文章数据集-2022年5月19日 数据来源:互联网公开数据 标签:新闻,越南,劳动报,NLP,文本分析,文章,爬取数据,自然语言处理 数据概述: 本数据集抓取自越南劳动报2022年5月19日的新闻文章,未经任何数据处理。数据集包含文章的多种属性,旨在为自然语言处理(NLP)任务提供数据支持。 数据包含以下字段: URL:文章链接。...
-
科技文章分类数据集TechnologyArticlesClassification-kaloyanyanchev
2025年5月17日 30 198 171
科技文章分类数据集TechnologyArticlesClassification-kaloyanyanchev 数据来源:互联网公开数据 标签:文章分类, 文本分析, 机器学习, 自然语言处理, 科技新闻, 数据集, 标签, 文本挖掘 数据概述:...
-
艺术评论文章主题分类数据集ArtReviewsTopicClassification-kazouneboubaisrael
2025年5月1日 30 89 21
艺术评论文章主题分类数据集ArtReviewsTopicClassification-kazouneboubaisrael 数据来源:互联网公开数据 标签:艺术评论, 文章分类, 文本分析, 艺术史, 文化传播, 自然语言处理, 机器学习, 语料库 数据概述:...
-
基于BRNN-GRU的文本分类模型数据集
2025年4月25日 30 58 9
基于BRNN-GRU的文本分类模型数据集 数据来源:互联网公开数据 标签:文本分类, BRNN-GRU, 深度学习, 自然语言处理, 预训练模型, 文章分类, 词典排序 数据概述: 本数据集包含基于Bidirectional Recurrent Neural Networks(BRNN)与Gated Recurrent...
-
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina
2025年4月24日 30 176 175
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,信息检索,计算机科学,数据分析,教育研究 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:...
-
新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem
2025年4月23日 30 7 1
新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem 数据来源:互联网公开数据 标签:新闻,文章分类,数据集,文本分析,机器学习,自然语言处理,信息检索,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的文章数据,记录了不同类别的新闻文章内容及其分类标签。主要特征如下:...
-
文章分类数据集ArticlesClassificationDataset-mohamedalqblawi
2025年4月23日 30 60 37
文章分类数据集ArticlesClassificationDataset-mohamedalqblawi 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,数据分析,信息检索,内容分析,智能推荐 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:...
-
游戏评分文章分类数据集2019
2025年4月15日 30 110 36
游戏评分文章分类数据集2019 数据来源:互联网公开数据 标签:游戏,评分,文章分类,情感分析,机器学习,游戏评论,视频游戏 数据概述:...



