找到6个数据集

标签: 软件提及

过滤结果
  • 人身保护令软件提及引用可发现性数据

    2026年2月15日 30 154 97

    数据集概述 本数据集包含用于软件提及采样和注释分析的相关数据及Jupyter笔记本,是Stephan Druskat等人提交至PeerJ Computer Science特刊的研究成果配套资料,可支持对软件引用与可发现性研究中相关挑战的探索分析。 文件详解 README.md 文件格式:.md...
    packageimg
  • Papers_With_Code_Based_软件提及语料库数据

    2026年2月12日 0 115 52

    数据集概述 本数据集是从Papers With Code平台下载的出版物列表中构建的软件提及语料库,通过筛选包含GitHub仓库元数据的论文文本生成。数据集仅包含一个压缩文件,未划分训练/测试集、数据/标签集或原始/处理集,文件类型单一。 文件详解 文件名称:papers_with_code_corpus.zip 文件格式:ZIP(压缩包)...
    packageimg
  • Softcite_Based_科学文献软件提及标注数据集_Version2

    2026年1月21日 30 103 16

    数据集概述 本数据集为Softcite Dataset Version 2,包含4971篇英文开放获取科学文献的软件提及标注,涵盖生命科学与经济学领域,共约4600万词。标注经多阶段人工标注与冲突协调,新增软件类型细分(环境、组件、隐式)及编程语言标注,是科学文献软件提及分析的金标准语料库。 文件详解 压缩包文件...
    packageimg
  • SoMeSci_科学文献中的软件提及数据集

    2025年12月13日 30 135 53

    数据集概述 该数据集是通过人工标注构建的科学文献中软件提及的黄金标准知识图谱,包含原始黄金标准数据及所有软件相关引用的标注内容,为科学文献中软件提及的研究提供标准化数据支持。 文件详解 Formal_Citation.zip:压缩文件,包含所有软件相关引用的标注数据 SoMeSci.zip:压缩文件,包含原始SoMeSci黄金标准数据 数据来源...
    packageimg
  • PMC_Based_SoftwareKG_PMC_软件知识图谱完整数据

    2025年12月6日 30 156 62

    数据集概述 本数据集是从PMC开放获取数据集中提取的软件提及知识图谱(SoftwareKG-PMC),以CSV格式压缩包存储。因PDF格式文章未被纳入,涉及的文章总数为三百零三万六千九百一十三篇,为软件相关学术提及的关联分析提供结构化数据支持。 文件详解 文件名称: csv_files.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • Softcite数据集_研究出版物中的软件提及标注数据集

    2025年12月4日 30 136 129

    数据集概述 该数据集是研究出版物中软件提及的标注数据集,包含生物医学和经济学领域开放获取文献中的软件提及标注,涉及软件名称、版本、访问URL等信息,以TEI/XML格式存储,还包含描述数据集设计与创建过程的论文。 文件详解 文件名称:howisonlab/softcite-dataset-v1.0.zip 文件格式:ZIP压缩包 压缩包内包含:...
    packageimg