论文_使用知识图谱嵌入和层次聚类的分类法提取_补充材料

数据集概述

该数据集为论文"使用知识图谱嵌入和层次聚类的分类法提取"的补充材料,包含非表达性分类法提取任务的输入数据、黄金标准,以及非表达性和表达性案例的提取分类法示例,可辅助理解论文研究方法与结果。

文件详解

  • readme.txt: 文本格式,说明文件内容,包括非表达性与表达性分类法提取的数据构成,如黄金标准文件、输入数据及提取结果文件的对应关系。
  • non_expressive.html: HTML格式,限制为命名类别的提取分类法示例,用于定量评估。
  • expressive.html: HTML格式,包含表达性分类法示例,展示更丰富的分类结构。
  • taxonomy_pred.txt: 文本格式,基于TransE嵌入、余弦相似度和平均链接的Soft Mapping方法生成的DBpedia-Freq分类法预测结果。
  • taxonomy_true.txt: 文本格式,非表达性分类法提取的黄金标准数据(论文中命名为"DBpedia-Freq")。
  • dbpedia-freq.csv: CSV格式,包含id、uri、type字段的输入数据,示例数据如dbr:UL_Bohemians_R.F.C.(类型dbo:Agent)等。

适用场景

  • 自然语言处理研究: 用于分类法提取算法的复现与验证,对比不同方法的性能差异。
  • 知识图谱构建: 辅助知识图谱中分类体系的自动生成与优化研究。
  • 信息检索优化: 为基于分类法的信息检索系统提供数据支持,提升检索准确性。
  • 学术论文补充验证: 支持对论文研究结论的进一步分析与扩展。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.56 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。