找到2个数据集

标签: 词干化文本

过滤结果
  • SUSdblp_Based_学术出版物分类数据集

    2026年2月1日 30 179 3

    数据集概述 本数据集包含dblp平台1980篇学术出版物的引用网络数据,通过AMiner平台数据补充,用于区分开创性、非影响力和综述类出版物。数据扩展自SeminalSurveyDBLP数据集,涵盖129,442篇论文的引用关系、dblp标识、发表年份、标题与摘要的词干化及原始文本,以及引用量和领域时间归一化引用计数等信息。 文件详解...
    packageimg
  • SeminalSurveyDBLP_Based_学术出版物分类数据集2019

    2026年1月20日 30 24 6

    数据集概述 本数据集包含来自dblp的1320篇学术出版物的引用网络数据,结合AMiner数据用于区分开创性(Seminal)和综述性(Survey)出版物。数据涵盖121,084篇相关论文的dblp标识、发表年份、标题与摘要的词干化及非词干化文本,开创性论文来自A*会议,综述来自专业综述期刊。 文件详解...
    packageimg