-
CONTRAST_IT_Based_西班牙语报纸文章语料库数据
2026年1月28日 30 40 24
数据集概述 本数据集是CONTRAST-IT多语言语料库的西班牙语部分,包含2011-2012年来自西班牙《国家报》(elpais.com)和《世界报》(elmundo.es)的476篇完整新闻文章,总字数约30万字,文本具有当代西班牙语报纸语言代表性,用于构建对比语言学研究用的语料库。 文件详解 文件组:CONTRAST-IT西班牙语新闻文章集...
-
荷兰新闻标题数据集
2025年4月14日 30 209 175
荷兰新闻标题数据集 数据来源:互联网公开数据 标签:新闻标题,荷兰新闻,讽刺检测,新闻分类,政治新闻,国际新闻,国内新闻,自然语言处理,文本分析 数据概述: 本数据集包含来自两个荷兰新闻网站的新闻标题,涵盖正常新闻标题和讽刺性新闻标题。讽刺性标题来源于荷兰网站 Speld.nl(类似于美国的 The Onion),而正常新闻标题则来源于新闻网站...



