-
WD4P_多标注模式知识图谱链接预测基准数据集
2025年12月18日 30 7 5
数据集概述 该数据集是基于Wikidata构建的多标注模式知识图谱链接预测基准,包含基础三元组(s-p-o)及三种标注模式(t-p-o、s-p-t、t-p-t),由WD50K和FBHE数据集整合而来,适用于知识图谱链接预测任务的模型评估。 文件详解 文件名称:wd4p.zip:压缩格式,包含完整的WD4P基准数据集,涵盖所有四种标注模式的知识图谱数据...
-
法国建筑技术规范木工条款命名实体识别与关系抽取标注数据集
2025年12月15日 30 13 5
数据集概述 本数据集包含从法国建筑技术规范(CCTP)中提取的二百三十三条原始木工条款要求,来源于七十二份法国公共建筑项目的CCTP文档,涵盖一万九千七百二十五句、六十五万一千九百四十八个词。数据集通过Doccano工具完成命名实体识别(NER)和关系抽取(RE)标注,适用于建筑领域需求工程的自然语言处理研究。 文件详解...
-
西班牙语循证医学临床试验语料库3版
2025年12月12日 30 112 94
数据集概述 该数据集是西班牙语的循证医学临床试验语料库(3版),包含一千二百篇文本(二十九万二千一百七十三条词元),涵盖期刊摘要与临床试验公告,标注了医学实体、语义关系等信息,为医学文本分析提供支持。 文件详解 文件名称:CT-EBM-SP-v3.zip 文件格式:ZIP压缩包...
-
火星目标百科全书_月球与行星科学会议标注摘要数据集2015_2016
2025年12月11日 30 95 90
数据集概述 本数据集包含2015年和2016年月球与行星科学会议(LPSC)发表的117篇摘要的标注文本数据,通过Apache Tika工具提取PDF文本,并以brat标注工具格式提供实体与关系注释,支持文本挖掘与信息提取研究。 文件详解 压缩文件:lpsc-annotated.zip(ZIP格式),包含以下目录和文件:...
-
TBGA基因疾病关联生物医学关系抽取数据集
2025年12月7日 30 130 24
数据集概述 该数据集为TBGA,是用于基因-疾病关联(GDA)抽取的大规模半自动标注数据集,包含训练、验证、测试集文本文件及关系名称与ID映射的JSON文件,每条记录对应从句子中提取的单个GDA,以JSON对象结构存储相关信息。 文件详解 数据集压缩包: TBGA.zip,ZIP格式,包含TBGA文件夹及内部所有文件 训练集文本文件:...
-
PMC_Based_SoftwareKG_PMC_软件知识图谱完整数据
2025年12月6日 30 75 47
数据集概述 本数据集是从PMC开放获取数据集中提取的软件提及知识图谱(SoftwareKG-PMC),以CSV格式压缩包存储。因PDF格式文章未被纳入,涉及的文章总数为三百零三万六千九百一十三篇,为软件相关学术提及的关联分析提供结构化数据支持。 文件详解 文件名称: csv_files.zip 文件格式: ZIP压缩包 内容说明:...
-
企业实体匹配训练数据集
2025年11月12日 30 135 23
企业实体匹配训练数据集_Business_Entity_Matching_Training_Dataset 数据来源:互联网公开数据 标签:实体匹配, 数据融合, 相似度计算, 机器学习, 数据清洗, 关系抽取, 结构化数据, 知识图谱 数据概述: 该数据集包含多个CSV文件(train_data1.csv, train_data2.csv,...
-
文本信息实体识别与匹配评估数据集
2025年11月1日 30 113 106
文本信息实体识别与匹配评估数据集_Text_Information_Entity_Recognition_and_Matching_Evaluation_Dataset 数据来源:互联网公开数据 标签:实体识别, 文本匹配, 自然语言处理, 机器学习, 评估数据集, 命名实体识别, 关系抽取, 文本标注 数据概述:...
-
疾病医学知识实体关系数据集
2025年10月17日 30 51 23
疾病医学知识实体关系数据集_Disease_Medical_Knowledge_Entity_Relationship 数据来源:互联网公开数据 标签:医学知识, 疾病诊断, 实体识别, 关系抽取, 数据挖掘, 生物医学, 机器学习, 知识图谱 数据概述:...
-
医学文本信息抽取验证数据集
2025年10月10日 30 5 1
医学文本信息抽取验证数据集_Medical_Text_Information_Extraction_Validation_Dataset 数据来源:互联网公开数据 标签:医学文本, 信息抽取, 命名实体识别, 关系抽取, 文本标注, 机器学习, 自然语言处理, 医疗健康 数据概述:...
-
文本信息实体识别与关系抽取评估数据集
2025年8月25日 60 186 67
文本信息实体识别与关系抽取评估数据集_Text_Information_Entity_Recognition_and_Relation_Extraction_Evaluation 数据来源:互联网公开数据 标签:实体识别, 关系抽取, 自然语言处理, 文本标注, 深度学习, 模型评估, 机器学习, 文本分析 数据概述:...
-
问答匹配与答案推荐数据集
2025年9月6日 30 1 0
问答匹配与答案推荐数据集_Question_Answering_Matching_and_Answer_Recommendation_Dataset 数据来源:互联网公开数据 标签:问答系统, 文本匹配, 答案推荐, 自然语言处理, 机器学习, 信息检索, 数据标注, 关系抽取 数据概述:...
-
文本信息匹配结果评估数据集
2025年8月21日 30 77 38
文本信息匹配结果评估数据集_Text_Information_Matching_Evaluation_Results 数据来源:互联网公开数据 标签:文本匹配, 信息检索, 自然语言处理, 机器阅读理解, 模型评估, 深度学习, 关系抽取, 标注数据 数据概述:...
-
知识图谱实体关系数据集
2025年8月13日 30 207 59
知识图谱实体关系数据集_Knowledge_Graph_Entity_Relation_Dataset 数据来源:互联网公开数据 标签:知识图谱, 实体识别, 关系抽取, 语义分析, 数据挖掘, 自然语言处理, 维基百科, 知识表示 数据概述: 该数据集包含从维基百科提取的知识图谱相关数据,记录了实体、属性、关系等信息。主要特征如下:...
-
多语言实体关系抽取数据集
2025年8月5日 30 32 27
多语言实体关系抽取数据集_Multilingual_Entity_Relation_Extraction_Dataset 数据来源:互联网公开数据 标签:关系抽取, 自然语言处理, 文本挖掘, 嵌入向量, 多语言, 知识图谱, 实体识别, 机器学习 数据概述:...
-
医学文本信息抽取评估数据集
2025年7月22日 30 66 40
医学文本信息抽取评估数据集_Medical_Text_Information_Extraction_Evaluation_Dataset 数据来源:互联网公开数据 标签:医学文本, 信息抽取, 命名实体识别, 关系抽取, 评估数据集, 深度学习, 自然语言处理, 文本标注 数据概述:...
-
基于阅读理解的对话关系抽取数据集-QaZre-thedevastator
2025年6月4日 30 176 61
基于阅读理解的对话关系抽取数据集-QaZre-thedevastator 数据来源:互联网公开数据 标签:自然语言处理,关系抽取,阅读理解,知识图谱,对话,机器学习,文本分析 数据概述:...
-
孟加拉语新闻语料库数据集
2025年5月31日 30 61 32
孟加拉语新闻语料库数据集 数据来源:互联网公开数据 标签:新闻,孟加拉语,文本分类,语言模型,文本生成,关系抽取,命名实体识别,词性标注 数据概述:...
-
知识图谱实体关系匹配与时序数据分析数据集KnowledgeGraphEntityRelationMatchingandTimeSeriesDataAnal...
2025年5月30日 30 20 17
知识图谱实体关系匹配与时序数据分析数据集KnowledgeGraphEntityRelationMatchingandTimeSeriesDataAnalysis-vincentholmes 数据来源:互联网公开数据 标签:知识图谱, 实体关系, 时序数据, 数据匹配, 关系抽取, YAGO, 数据融合, 知识推理 数据概述:...
-
实体匹配预测结果分析数据集EntityMatchingPredictionAnalysis-takoihiraokazu
2025年5月29日 30 16 3
实体匹配预测结果分析数据集EntityMatchingPredictionAnalysis-takoihiraokazu 数据来源:互联网公开数据 标签:实体匹配, 预测分析, 机器学习, 相似度计算, 数据挖掘, 文本分析, 关系抽取, 知识图谱 数据概述: 该数据集包含实体匹配预测相关数据,记录了实体匹配任务的预测结果和相关特征。主要特征如下:...



