TecKnoGraph_C4ISTAR专利知识图谱数据集

数据集概述

该数据集包含通过TecKnoGraph生成的C4ISTAR领域专利知识图谱样本,由知识图谱三元组数据、专利文本文件及相关附录文档组成,为研究C4ISTAR领域专利技术关联提供结构化与原始数据支持。

文件详解

  • 知识图谱数据文件:
  • TecKnoGraph-C4ISTAR-sample.csv:CSV格式,存储知识图谱三元组数据,包含字段:source_label(源标签)、source(源实体)、rel(关系)、target(目标实体)、target_label(目标标签)、patentId(专利ID)、relation_tag(关系标签)
  • 专利原始数据文件:
  • patents.zip:ZIP压缩包,包含10,000份专利的TXT文本文件
  • 附录文档:
  • Appendix A.pdf、Appendix B.pdf、Appendix C.pdf:PDF格式,对应论文的附录文件
  • TecKnoGraph - Example picture.pdf:PDF格式,知识图谱示例图片

适用场景

  • 专利技术分析:用于挖掘C4ISTAR领域专利中的技术实体关联与知识图谱构建
  • 自然语言处理研究:可作为专利文本语义抽取与知识图谱生成的实验数据
  • 技术情报挖掘:支持从专利文本中提取技术关系、识别技术热点与演进路径
  • 知识图谱应用开发:为C4ISTAR领域知识图谱相关工具开发提供样本数据参考
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 17.86 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。