德国新闻文章分类数据集-2011-abhishek

德国新闻文章分类数据集-2011-abhishek 数据来源:互联网公开数据 标签:新闻文章,分类,德语,文本分析,自然语言处理,学术研究,工业应用

数据概述: 本数据集包含10,000篇德语新闻文章,适用于主题分类研究。数据来源于Dietmar Schabus, Marcin Skowron和Martin Trapp于2017年在ACM SIGIR会议上的研究成果《一百万帖子:德语在线讨论数据集》。该数据集还与Dietmar Schabus和Marcin Skowron于2018年在LREC会议上的论文《学术与工业视角:开发和部署新闻网站评论审核系统的经验》相关联。

数据包含了新闻文章的文本内容,适用于自然语言处理和信息检索领域的研究与应用。

数据用途概述: 该数据集适用于新闻主题分类、文本情感分析、信息检索系统开发等场景。研究人员可以利用此数据集进行算法评估和模型训练;企业可以使用该数据集优化内容管理系统和用户评论审核流程。此外,该数据集也适合用于自然语言处理课程的教学和研究,帮助学生理解文本分类的基本原理与应用。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 03:28 (UTC)
创建于 五月 31, 2025, 03:27 (UTC)