LLM_Knowledge_Graph_基于大语言模型的知识图谱提取研究补充材料数据

数据集概述

本数据集是论文《From Source to Structure – Extracting Knowledge Graphs with LLMs》的补充材料,包含LLM生成与合成工作流的完整JSON日志。数据覆盖HPSS研究者和AI/ML工程师两个学科视角,记录了八模型并行生成评论及单模型合成元评论的过程,共含四个文件。

文件详解

  • 反馈文件(Feedback.json)
  • 文件名称:OpenRouter Chat - Engineer Feedback.json、OpenRouter Chat - HPSS Feedback.json
  • 文件格式:JSON
  • 字段映射介绍:包含八大型语言模型并行生成评论的原始聊天记录,含模型版本、提示词(系统/用户)、采样参数及未修改输出等元数据。
  • 总结文件(Summary.json)
  • 文件名称:OpenRouter Chat - Engineer Summary.json、OpenRouter Chat - HPSS Summary.json
  • 文件格式:JSON
  • 字段映射介绍:包含单LLM合成八模型响应得到的结构化元评论日志,含模型版本、提示词(系统/用户)、采样参数及未修改输出等元数据。

数据来源

论文《From Source to Structure – Extracting Knowledge Graphs with LLMs》(发表于Large Language Models for the History, Philosophy, and Sociology of Science: Reflections from a Field in Motion)

适用场景

  • LLM知识图谱构建工作流研究:分析两阶段生成与合成流程的效果,优化LLM驱动的知识提取方法。
  • 跨学科视角对比分析:对比HPSS研究者与AI/ML工程师视角下LLM生成内容的差异,探究学科背景对知识图谱构建的影响。
  • LLM模型性能评估:基于八模型并行生成结果,评估不同LLM在知识评论生成任务中的表现。
  • 元评论合成策略优化:研究单LLM合成多模型响应的方法,提升结构化元评论的质量与效率。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.69 MiB
最后更新 2026年1月18日
创建于 2026年1月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。