-
PaGA_12_Based_26类体裁德语文本分类语料库
2026年1月30日 30 59 45
数据集概述 本数据集为2012年帕德博恩体裁分析语料库(PaGA-12),包含1639个HTML文档,覆盖26种文本体裁。所有文档采集于2009年10月18日至11月20日,每个文档手动标注唯一体裁,每种体裁至少包含50个文档。文档均为德语文本,已移除框架集,以MySQL数据库转储形式交付。 文件详解 文件名称:corpus-paga-12.zip...
-
CoInfo_Enancib_2025_农村与听障社区信息能力研究文档数据
2026年1月21日 30 17 5
数据集概述 本数据集为Enancib 2025项目完整工作所筛选的文档数据表格,聚焦农村社区与听障社区的信息能力相关内容,包含1个文件,用于支持该项目的研究分析工作。 文件详解 文件名称:CoInfo - Selecionados.xlsx 文件格式:XLSX...



