SoftwareKG_Based_社会科学领域知识图谱完整数据

数据集概述

该数据集为SoftwareKG知识图谱,包含从PLoS平台51,165篇带“Social Science”标签的文章中提取的133,000余个软件提及信息,通过自动化流程提取并关联缩写与DBpedia,结合文章元数据构建,采用W3C标准RDF/S模型表示。

文件详解

  • 文件名称: ESWC-SoftwareKG.zip
  • 文件格式: ZIP压缩包
  • 包含内容:
  • 最终SoftwareKG的N-Triples文件(software_kg.zip)
  • 结果复现所需源代码(softwareKG)
  • NER模型训练评估用SoSciSoCi语料库
  • NER模型预训练用SoSciSoCi-SSC银标准语料库

数据来源

https://data.gesis.org/softwarekg/site/、GitHub(https://github.com/f-krueger/ESWC-SoftwareKG/releases/tag/v1.0

适用场景

  • 社会科学领域软件使用情况研究
  • 知识图谱构建与语义网技术应用分析
  • 命名实体识别(NER)模型训练与评估
  • 学术文献中软件提及模式挖掘
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 435.87 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。