科学知识图谱大语言模型构建数据集

科学知识图谱大语言模型构建数据集 数据来源:互联网公开数据 标签:科学知识图谱,大语言模型,KG,LLM,数据集,关系提取,实体识别,文本处理 数据概述: 本数据集是基于sciERC数据集转换而来,适用于使用大语言模型构建知识图谱(KG)。数据集仅使用了原始处理数据集中的句子、关系和doc_key列。输入句子由空白字符连接的标记组成,关系列表以元组列表的形式提供。每个元组的格式为(源实体,目标实体,关系)。 数据用途概述: 该数据集适用于知识图谱构建、关系提取、实体识别以及大语言模型训练等多种场景。研究人员可以利用此数据集进行知识图谱的构建和优化;数据科学家可以将其用于关系抽取算法的开发与测试;教育者可以使用该数据集进行自然语言处理和机器学习的教学。该数据集为相关研究和开发提供了有价值的数据支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.15 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。