找到11个数据集

标签: 学术数据挖掘

过滤结果
  • ScanBank_Based_扫描电子学位论文图表提取基准数据集

    2026年1月28日 30 77 51

    数据集概述 本数据集是用于从扫描电子学位论文中提取图表的基准数据集,包含标注文件、配置文件、代码文件等16个文件,支持图表提取任务的模型训练、验证与测试,为学术文档处理领域的图表检测研究提供标准化数据支撑。 文件详解 标注相关文件...
    packageimg
  • SLCT_Based_科学文献比较表数据集子集

    2026年2月1日 30 178 33

    数据集概述 本数据集为科学文献比较表(SLCT)数据集的子集,通过arXiv和Semantic Scholar API收集,经预处理、表格提取、引用数据获取等步骤处理而成,包含文献比较表相关数据,总计1个文件。 文件详解 文件名称:A subset of Scientific Literature Comparison Tables...
    packageimg
  • SciExpeM_Based化学反应动力学数据集

    2026年2月1日 30 126 9

    数据集概述 本数据集来自Zenodo平台,与Rasmussen等人发表于《International Journal Of Chemical Kinetics》2008年的研究相关,通过SciExpeM系统组织,包含化学反应动力学相关的XML格式元数据文件,为化学动力学研究提供结构化数据支持。 文件详解...
    packageimg
  • Webscraping_学术出版商期刊计数数据集与代码

    2026年1月31日 30 133 108

    数据集概述 本数据集包含用于研究学术期刊出版商的代码与数据,涵盖从DOAJ、Publons、Scopus和SherpaRomeo四个数据源提取出版商及期刊计数的R代码、DOAJ和Scopus的数据样本、出版商名称 harmonization的文本文件和R代码,以及最终排序的学术期刊出版商结果列表,总计9个文件。 文件详解 代码文件(.r格式,共5个)...
    packageimg
  • SciExpeM_Based_科学数据XML文件_2011

    2026年1月29日 30 61 2

    数据集概述 本数据集为SciExpeM项目相关的科学数据,包含一篇2011年发表于《Chinese Science Bulletin》的论文关联数据,主要以XML格式存储,用于科学研究相关的数据管理与共享。 文件详解 文件名称:10.5281/zenodo.7772025.xml 文件格式:XML 字段映射介绍:包含与论文Zhang, Y-J.,...
    packageimg
  • LMANStat_Based_大规模多层学术网络数据集_2023

    2026年1月28日 30 174 150

    数据集概述 本数据集为“Large-scale Multi-layer Academic Networks (LMANStat)”,来源于统计出版物相关的学术网络研究,包含大规模多层学术网络数据及对应研究代码,支持学术网络结构与关系的分析研究。 文件详解 文件名称:Gaotianchen97/LMANStat-v1.2.0.zip 文件格式:ZIP...
    packageimg
  • SciELO_Based_Bardin内容分析法学术文章评估数据

    2026年1月28日 30 52 1

    数据集概述 本数据集基于Bardin内容分析方法,对SciELO网站筛选出的17篇学术文章进行数据整理与制表。数据源自研究“RIGOR METODOLÓGICO NA APLICAÇÃO DA ANÁLISE DE CONTEÚDO: UMA REVISÃO COM ÊNFASE EM...
    packageimg
  • SDG13_Based联合国可持续发展目标出版物识别方法比较研究数据2022

    2026年1月20日 30 31 27

    数据集概述 本数据集围绕联合国可持续发展目标13(气候行动)相关出版物识别方法的比较研究,包含研究中使用的样本DOI数据和检索词分类数据,支持对不同识别方法的效果评估与分析。 文件详解 文件名称:Sample_DOIs.xlsx 文件格式:XLSX 字段映射介绍:包含与SDG13气候行动相关的出版物样本DOI信息,用于识别方法的测试与验证...
    packageimg
  • Credibility_Author_Dataset_学术作者可信度分析数据

    2026年1月20日 30 21 6

    数据集概述 本数据集包含一百万作者相关数据,以及对应的输出Excel文件、Matlab分析代码和斯坦福2%作者列表的p值分析结果,还提供用于单作者分析的Full_ACI_2代码。数据集共包含4个文件,涵盖数据文件与代码文件两类,可支持学术作者可信度相关的分析研究。 文件详解 数据文件 文件名称:authors_data_100k.xlsx...
    packageimg
  • SciExpeM_Combustion_And_Flame_论文数据_2001

    2026年1月20日 30 167 51

    数据集概述 本数据集来自SciExpeM平台,对应论文《Combustion And Flame》2001年发表的研究内容,由Alzueta、Bilbao、Glarborg共同完成。数据集包含1个XML格式文件,无目录分层或数据拆分,核心为论文相关的结构化数据。 文件详解 文件名称:10.5281/zenodo.5084457.xml 文件格式:XML...
    packageimg
  • 基于知识图谱嵌入的作者名消歧数据集_含文本与数值字面量

    2025年12月10日 30 136 89

    数据集概述 本数据集包含两个学术知识图谱,分别来源于OpenCitations提供的《Scientometrics》期刊三元组存储和2018年AMiner作者名消歧(AND)基准数据集。数据按文本字面量、数值字面量分类存储,支持多模态知识图谱嵌入研究,含评估数据集及预处理的嵌入文件。 文件详解 该数据集包含3个文件,具体说明如下: - 文档文件: -...
    packageimg