数据集 - 海数据

知识库转储_Wikidata厨房用具数据

2026年2月9日

数据集概述本数据集是通过wdumps工具生成的Wikidata RDF转储，聚焦厨房用具子类。包含4个文件，无实体、陈述及三元组数据，主要提供转储元信息、规格说明、预览及压缩数据文件，可用于Wikidata厨房用具子类相关的语义数据研究与处理。文件详解元信息文件文件名称：info.json 文件格式：JSON...

ZIP

OpenCare_Based语义社交网络数据

2026年2月9日

数据集概述本数据集包含OpenCare项目的一级和二级数据，一级数据为在线对话（帖子和评论），二级数据为基于一级数据的民族志工作成果（注释和代码或标签）。数据集提供5个文件，支持通过API访问（需申请密钥），可用于研究OpenCare项目的语义社交网络特征。文件详解数据文件包定义文件文件名称：datapackage.json 文件格式：JSON...

ZIP

知识库数据_Wikidata厨房用具实体数据

2026年2月9日

数据集概述本数据集是基于wdumps工具生成的Wikidata RDF转储数据，聚焦厨房用具子类，包含4个相关文件，涵盖配置信息、规格说明、预览数据及压缩数据文件，为厨房用具领域的知识图谱构建提供结构化数据支持。文件详解 info.json 文件格式：JSON...

ZIP

荷兰传记门户_生物信息_关系抽取_标注数据集

2026年2月1日

数据集概述本数据集为荷兰传记文本的人工标注关系抽取数据集，包含14类生物信息相关关系，如出生时间、居住地、亲属关系等。数据源自荷兰传记门户，包含测试集数据及说明文档，共2个文件，用于自然语言处理领域的关系抽取任务研究。文件详解 README.md 文件格式：.md...

ZIP

知识图谱构建_Wikidata厨房用具子类数据

2026年2月9日

数据集概述本数据集是通过wdumps工具生成的Wikidata中厨房用具子类的RDF转储数据。包含实体、陈述、三元组等相关信息，以多种文件格式存储，支持对Wikidata中厨房用具子类知识的提取与分析。文件详解文件名称：info.json 文件格式：JSON...

ZIP

wdumps_Wikidata_RDF转储数据

2026年2月9日

数据集概述本数据集是由wdumps工具生成的Wikidata RDF转储数据，包含4个文件，涵盖配置文件、规格文件、压缩数据文件和预览文件四类，可用于Wikidata知识图谱相关的数据存储、解析与应用开发。文件详解配置与规格文件文件名称：info.json 文件格式：JSON...

ZIP

PROV_Based_BFO本体映射数据2025

2026年1月31日

数据集概述本数据集为PROV-to-BFO映射项目的2025年1月19日版本数据，是对PROV（PROV-O）与BFO（Basic Formal Ontology）本体映射关系的整理结果，通过GitHub仓库进行版本迭代，本次为该项目的更新版本，包含一个压缩文件。文件详解文件名称：PROV-to-BFO-v2025-01-19.zip...

ZIP

Annex_Based_疫苗民族主义媒体报道分析数据库

2026年2月9日

数据集概述本数据集为研究论文《“疫苗民族主义”在“西班牙疫苗”抗SARS-CoV-2媒体报道中的纵向分析》所使用的新闻报道分析数据库附件，包含经分析的新闻报道数据，用于支撑论文对疫苗民族主义相关媒体报道的研究。数据集仅有一个文件。文件详解文件名称：Arboledas-Lérida and Alcíbar-Cuello. Annex I to...

ZIP

FrameNet_嵌入模型软件及需求工程_语义框架嵌入技术

2026年1月29日

数据集概述本数据集包含软件与需求工程领域的FrameNet语义框架嵌入数据，旨在识别该领域中FrameNet语义框架的语义相关性。数据通过基于上下文的方法获取，相关方法在ESEM 2018会议论文中有详细描述。文件详解文件名称：frame_embeddings_avg.zip 文件格式：ZIP...

ZIP

Wikidata_P241_Based_军事分支RDF转储数据

2026年1月28日

数据集概述本数据集是通过wdumps工具生成的Wikidata P241（军事分支）属性的RDF转储数据，包含4个文件，涵盖配置信息、规格说明、压缩数据及预览文件，可用于军事分支相关数据的查询与分析。文件详解 info.json 文件格式：JSON...

ZIP

TextGrid_CC_BY_3_0授权_XML格式语料库数据

2026年1月28日

数据集概述本数据集为XML格式的文本语料库压缩包，所有文本源自TextGrid平台，由Katrin Dennerlein博士整理。语料库采用CC-BY 3.0协议授权，相关研究在《席勒-克莱斯特不确定性原理》中被提及，可用于计算机语言学或文本分析相关研究。文件详解文件名称：XML.zip 文件格式：ZIP（压缩包）...

ZIP

Wikidata_Based经济单元与人物实体RDF转储数据

2026年2月8日

数据集概述本数据集是基于Wikidata的RDF转储数据，由wdumps工具生成，聚焦经济单元（如公司、企业等）和人物（如商人、企业家等）相关实体及属性，包含4个文件，实体数、陈述数、三元组数均为0，提供结构化的知识图谱数据支持。文件详解文件名称：info.json 文件格式：JSON...

ZIP

Wikidata_Q31_RDF_Based知识图谱数据转储

2026年2月8日

数据集概述本数据集是通过wdumps工具生成的Wikidata Q31的RDF格式数据转储，包含实体、陈述和三元组信息，共4个文件，覆盖JSON、NT、GZ等格式，用于语义网知识图谱相关的研究与应用。文件详解信息文件（info.json）文件名称：info.json 文件格式：JSON...

ZIP

LC_QuAD_2_1_Based_清洗版知识库问答实验数据集

2026年2月8日

数据集概述本数据集是LC-QuAD 2.0的清洗版本，包含移除异常值和重复问题后的知识库问答数据，提供Wikidata和DBpedia 2018的虚拟SPARQL模板，以及论文使用的训练、开发、测试集，含带与不带复述问题的两个训练集，共四个JSON文件。文件详解训练集（无复述问题）...

ZIP

Appen_Based_产品发布未来信息标注网页数据集

2026年2月7日

数据集概述本数据集为标注数据集，包含约三万条网页数据，由众包标注员完成标注。每条网页由四至六名标注员标记是否包含未来产品发布信息，标注结果含置信度评分，基于标注员间一致性及信任分数计算。数据可用于识别网页中的未来产品发布相关文本。文件详解压缩文件：文件名称：product_releases_v1_dataset.csv.zip 文件格式：ZIP...

ZIP

PLOSOne_Hsieh_2016_听觉运动处理fMRI实验数据集

2026年2月6日

数据集概述本数据集为PLOS One 2016年Hsieh等人研究的听觉运动处理fMRI数据，聚焦3D虚拟听觉空间中不同速度声源对大脑皮层的激活模式，对比慢速物体运动与快速头部旋转引发的听觉线索处理差异，探索运动感知的神经机制。文件详解文件名称：PLOSONEdataHsieh2016.zip 文件格式：ZIP（压缩包）...

Wikidata_dump_2021年7月10日RDF转储工具生成数据

2026年2月6日

数据集概述本数据集是2021年7月10日通过wdumps工具生成的Wikidata RDF转储数据，包含4个文件，涉及JSON、GZ压缩、NT格式，记录了数据转储的元信息、规格配置、RDF三元组等内容，可用于Wikidata数据的备份与分析。文件详解元信息文件文件名称：info.json 文件格式：JSON...

ZIP

语义数据_Wikidata_RDF转储数据

2026年2月1日

数据集概述本数据集是使用wdumps工具生成的Wikidata RDF转储数据，包含4个文件，涵盖配置说明、规格参数、预览数据和压缩数据四类内容，可用于获取Wikidata的结构化语义数据，支持语义网络相关研究与应用。文件详解 info.json 文件格式：JSON...

ZIP

NGI_Forward_语义社交网络编码数据

2026年2月1日

数据集概述本数据集是欧盟下一代互联网倡议（NGI Forward项目）的一部分，包含民族志学者对专题在线对话的编码结果及语义社交网络数据。数据以原始形式呈现，已伪匿名化，可用于进一步探索和复现研究，旨在为欧洲机构提供以人为中心的未来互联网政策建议。文件详解 annotations.csv（CSV格式）...