-
Kleptotrace_Based_金融腐败实体抽取微型基准数据集
2026年1月27日 30 39 17
数据集概述 本数据集为微型基准数据集,包含15篇聚焦金融腐败主题的文章(共441句),以及文章中提及的个人和组织列表各1份,用于评估基于大语言模型的实体抽取流程。 文件详解 文件名称:Dataset-org.json 文件格式:JSON 字段映射介绍:包含金融腐败主题文章的文本内容,以及从中提取的个人列表和组织列表两类实体信息 数据来源...
-
Wikidata_Dump_TextRobustness_知识图谱转储测试数据
2026年1月19日 30 170 81
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储文件,包含实体、陈述、三元组的结构化信息,以及转储工具版本、日期等元数据,共4个文件,用于测试文本稳健性相关研究与应用,支持知识图谱数据处理分析场景。 文件详解 元数据文件 文件名称:info.json 文件格式:JSON...
-
Wikidata_Dump_Based_Wikidata知识图谱RDF格式Dump数据
2026年1月14日 30 194 120
数据集概述 本数据集是通过wdumps工具生成的Wikidata的RDF格式Dump数据,包含实体、陈述和三元组等信息,共4个文件,覆盖JSON、NT等格式,为Wikidata知识图谱的使用和分析提供基础数据支持。 文件详解 info.json 文件格式:JSON...
-
AI增强型糖尿病护理沟通目标数据集
2025年12月12日 30 142 55
数据集概述 该数据集包含从中国广泛使用的在线远程医疗平台收集的匿名医患咨询记录,专为医疗领域的自然语言处理应用设计,重点关注糖尿病相关的医疗对话,分为原始中文和英文翻译两个压缩包,便于多语言研究。 文件详解 原始中文对话数据压缩包: 文件名称: original_txt.zip 文件格式: ZIP压缩包 内容说明:...
-
业务流程信息抽取辅助数据标注数据集
2025年12月10日 30 3 0
数据集概述 该数据集围绕文本文件中业务流程信息抽取的辅助数据标注展开,包含标注指南、问卷、工作负荷数据及实验结果等文件,为研究辅助标注对业务流程信息抽取任务的影响提供多维度数据支持。 文件详解 该数据集包含3个文档文件和3个数据文件,具体说明如下: - 文档文件: - Annotation-EN.pdf:...
-
教育研究文本标注数据集EducationResearchTextAnnotation-zahedi
2025年5月17日 30 81 19
教育研究文本标注数据集EducationResearchTextAnnotation-zahedi 数据来源:互联网公开数据 标签:文本标注, 教育研究, 自然语言处理, 命名实体识别, 文本分析, 数据挖掘, 学术研究, 实体抽取 数据概述:...
-
亚马逊商品图像结构信息抽取图像中商品属性数据集
2025年5月19日 30 164 18
数据概述: 本数据集用于图像信息抽取任务,目标是训练一个机器学习模型,从商品图像中提取关键属性值(如重量、电压、体积、尺寸等)。该能力广泛应用于医疗、电商和内容审核等场景,尤其适用于缺乏详细文本描述的数字商品信息补全。模型需识别图像中的特定属性值,并输出标准格式的预测结果。 字段说明: 训练数据(train.csv)包含以下字段:...



