中国通用常识知识图谱数据集15K

中国通用常识知识图谱数据集15K 数据来源:互联网公开数据 标签:常识知识图谱,中国,三元组,不确定性,实体关系,可信度评分,概率软逻辑

数据概述: 本数据集名为CN15K,是一个用于表示通用人类常识的知识图谱。该图谱包含了一系列三元组(head_id, relation_id, tail_id),每个三元组的数值表示不确定性,并配有一个可信度值。数据集由train.tsv、test.tsv和val.tsv三个文件组成,每个文件的每一行代表一个三元组及其可信度值。entity_id.csv和relation_id.csv文件分别记录了实体名称和关系名称对应的唯一ID。softlogic.tsv文件包含了用于推断未见关系事实可信度分数的概率软逻辑方法,该方法基于Xuelu Chen等人在2019年AAAI会议上的研究。

数据用途概述: 该数据集适用于常识推理、知识图谱补全、自然语言处理等多种应用场景。研究人员可以通过分析三元组及其可信度值来研究人类常识的表示和推理机制;开发人员可以利用该数据集训练和评估知识图谱补全模型;教育工作者可以使用数据集进行相关教学和研究,帮助学生理解常识知识图谱的构建和应用。此外,该数据集还为概率软逻辑的研究提供了实际应用案例。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 3.52 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。