-
IntelliGraphs_Based知识图谱生成模型基准测试数据集
2026年1月25日 30 23 2
数据集概述 本数据集是IntelliGraphs知识图谱生成模型基准测试数据集,包含三个合成数据集(syn-paths、syn-tipr、syn-types)和两个真实世界数据集(wd-movies、wd-articles),共5个压缩文件。配套Python包可加载数据集并基于预定义语义验证新图谱,支持生成模型开发与测试。 文件详解 合成数据集文件...
-
Text2KGBench本体驱动文本生成知识图谱基准数据集
2025年12月13日 30 32 1
数据集概述 该数据集是用于评估语言模型在本体引导下从文本生成知识图谱能力的基准,包含Wikidata-TekGen(十个本体、一万三千四百七十四句)和DBpedia-WebNLG(十九个本体、四千八百六十句)两个子数据集,遵循本体约束提取文本事实。 文件详解 数据集以压缩包形式提供,内部结构及内容如下: - 压缩包文件:...
-
纽约时报新闻小数据集
2025年12月7日 30 32 22
数据集概述 该数据集包含从纽约时报获取的10条新闻的前几段内容,收集于2023年Bertinoro语义网博士学校期间,由Dragon Team研究组用于项目工作。数据涉及大语言模型未包含的新信息,可用于知识图谱生成相关研究。 文件详解 文件名称: isws_pw_wikipedia_dataset - Latest News from Ney York...



