-
PAN16_Based_作者身份识别文档聚类测试训练数据
2026年1月30日 30 63 38
数据集概述 本数据集为PAN16作者身份识别聚类任务的文档集合,包含至多一百篇单作者文档,所有文档语言与体裁一致,但主题或文本长度可能不同。数据集未明确说明包含的不同作者数量,旨在用于识别文档间的作者身份关联及同一作者的文档分组。 文件详解 文件名称:pan16-author-clustering-test-and-training.zip...
-
学习生态领域文献共被引图谱数据集1991_2018
2025年12月15日 30 182 3
数据集概述 本数据集基于1991-2018年学习生态领域85篇文献的共被引分析,通过CiteNet Explorer软件生成共被引图谱,呈现核心作者群体、时间分布及理论关联,揭示领域发展脉络与跨学科特征。 文件详解 文件名称:Citing pub index.txt 文件格式:TXT...



