LOD云伪传递关系标注数据集

数据集概述

本数据集包含LOD云伪传递关系研究的人工标注金标准、图文件及评估结果,涵盖三元组标注数据、权重与非权重图文件、原始评估结果等,支撑传递关系优化算法的研究与验证。

文件详解

  • 金标准文件:
  • gold-standard.zip:压缩文件,含人工评估三元组数据,字段包括LEFT(源URI)、RIGHT(目标URI)、UserChioce(用户选择)、Decision*(标注决策:unknown/remove/remain)、Comment(备注)
  • Gold standard description.pdf:PDF文件,说明金标准的创建细节
  • 图文件:
  • graph_files.zip:压缩文件,含非权重图及两类权重图(counted_weights子目录为计数权重图、inferred_weights子目录为推理权重图),文件为*.gz格式,含源与目标整数映射(对应URI),映射文件在mapping目录;还包含WebGraph格式非权重图文件
  • 评估结果与原始数据:
  • raw-evaluation-results.pdf:PDF文件,原始评估结果
  • raw_data_removed_edges.zip:压缩文件,移除边的原始数据
  • other-files-for-gold-standard.zip:压缩文件,金标准相关其他文件
  • webGraphformat.zip:压缩文件,WebGraph格式文件

适用场景

  • 语义网研究:分析LOD云伪传递关系的特征与优化方法
  • 图算法验证:测试传递关系优化算法在WebGraph格式数据上的性能
  • 数据质量评估:基于人工标注金标准评估关系数据的准确性
  • 学术研究复现:支撑相关论文中表2、表3的实验结果复现与分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 253.26 MiB
最后更新 2025年12月19日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。