数据集 - 海数据

EOL_v3_Based_数据模型本体扩展数据

2026年2月1日

数据集概述本数据集包含EOL v3数据模型的本体扩展文件，主要涉及媒体、测量、发生等维度的本体定义，部分文件需配合样式表使用。共含4个文件，支持生物多样性数据模型的扩展应用，可通过指定论坛获取多用途聚合数据。文件详解 XML本体文件（3个）...

ZIP

CT_Based_否定表达不同方式影响研究数据

2026年2月1日

数据集概述本数据集围绕“否定表达不同方式的影响”展开，关联医学CT领域相关内容，包含1个压缩文件，无子目录结构，未划分训练/测试集、数据/标签集或原始/处理数据，可用于探索否定表达在医学CT场景中的应用影响。文件详解文件名称：The Effect of Different Ways for Expressing Negation.zip...

ZIP

开放实践中的AI隐喻与自我民族志反思_数据视角

2026年2月1日

数据集概述本数据集包含两部分内容：一是AI隐喻及其来源的收集数据，二是《Open Praxis》期刊待发表AI隐喻相关文章作者的自民族志反思。数据集共2个文件，均为Excel格式，无目录层级，可用于AI隐喻研究与学术写作反思分析。文件详解数据文件1：...

ZIP

新约圣经地名数据_基于Louw_Nida语义域

2026年2月1日

数据集概述本数据集源自Louw和Nida的《新约希腊语-英语词典》，包含新约圣经中出现的全部259个地理名称及其在《希腊新约》（SBL版）中的出现情况，为研究新约地理背景提供结构化数据支持。文件详解文件名称：newTestamentToponymsBasedOnLouwNidaSemanticDomains.xlsx 文件格式：XLSX...

ZIP

知识图谱数据处理_Wikidata厨房用品数据

2026年2月1日

数据集概述本数据集是通过wdumps工具生成的Wikidata RDF转储，聚焦于厨房用品子类。包含4个文件，涵盖元信息、转储规范、预览数据及压缩数据文件，记录实体、陈述和三元组计数等基础信息，为厨房用品领域的知识图谱研究提供结构化数据支持。文件详解元信息文件文件名称：info.json 文件格式：JSON...

ZIP

Sri_Lankan_分类广告匹配检索研究数据集

2026年2月1日

数据集概述本数据集为斯里兰卡分类广告市场的广告匹配、语义检索及意图对齐研究开发，包含54489个广告对，来源覆盖五大平台，含人类验证真实样本与LLM生成样本。覆盖电子、车辆、房产三大类及20个子类，支持低资源子类别模型泛化训练评估。文件详解...

ZIP

知识图谱_Wikidata_Q7561196数据

2026年2月1日

数据集概述本数据集是通过wdumps工具生成的Wikidata实体Q7561196的非弃用RDF转储数据，包含实体、语句、三元组等语义网格式的结构化信息，共4个文件，覆盖JSON、压缩文件、N-Triples等格式，可用于知识图谱相关的语义分析与应用开发。文件详解核心文件列表文件名称：info.json 文件格式：JSON...

ZIP

dsfsi_Based非洲语言新闻语料库2022

2026年2月1日

数据集概述本数据集为2022年的isiZulu新闻（含文章及标题）与Siswati新闻（仅标题）语料库，包含相关非洲语言的新闻文本资源，支持非洲语言的自然语言处理研究，数据集以单个压缩文件形式呈现。文件详解文件名称：dsfsi/za-isizulu-siswati-news-2022-v0.9.5.zip 文件格式：ZIP...

ZIP

Wikidata_Based_RDF转储全量数据

2026年2月1日

数据集概述本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据，包含实体、标签、描述、别名、站点链接、声明等知识图谱核心信息，以及数据生成工具的元数据记录。数据集共包含4个文件，涵盖配置、元数据、预览和压缩数据四种类型。文件详解文件名称：info.json 文件格式：JSON...

ZIP

基于民族主义保守主义变革语法的论文配套转录本数据

2026年2月1日

数据集概述本数据集为论文"A nationalist-conservative grammar of change?"的配套转录本，包含MS Word格式（带行号）和RData格式文件，共18个文件。Word版本为行号参考基准，RData版本可用于配套可复现示例分析，涵盖民族保守主义相关文本内容，支持相关主题的文本研究。文件详解论文配套转录本文件...

ZIP

S5_Data_Swahili匿名IDI转录本数据

2026年1月31日

数据集概述本数据集为S5 Data，包含斯瓦希里语中所有IDI（个体深度访谈）转录本的匿名版本，这些转录本基于S4 Data进行分析，并选择性翻译用于结果部分的引用。数据集仅包含一个文件。文件详解文件名称：S5 Data. IDIs transcripts.docx 文件格式：DOCX...

ZIP

Wikidata_Dump_人物数据RDF转储数据

2026年1月31日

数据集概述本数据集是通过wdumps工具生成的Wikidata人物数据RDF转储，包含4个文件，涵盖信息描述、规格说明、预览数据和压缩数据等内容，可用于获取结构化的Wikidata人物相关数据。文件详解 info.json 文件格式：JSON...

ZIP

INOTAXA_Based_分类学资源整合访问数据

2026年1月31日

数据集概述本数据集为INOTAXA平台相关的XML数据文件，INOTAXA是整合开放分类学访问的网络工作空间，可同时访问分类描述、鉴定密钥、目录、名称、标本数据、图像等资源。数据集包含1个XML文件，无目录结构，文件类型单一。文件详解文件名称：63.xml 文件格式：XML...

ZIP

Wikidata_RDF_Based转储数据_ma

2026年1月31日

数据集概述本数据集是通过wdumper工具生成的Wikidata的RDF格式转储数据，包含4个文件，涵盖信息描述、规范配置、预览数据及压缩数据等内容，实体数、陈述数、三元组数均为0，可用于了解Wikidata转储的文件结构与配置规范。文件详解 info.json 文件格式：JSON...

ZIP

Wikidata_Dump_英文歌曲RDF转储数据

2026年1月31日

数据集概述本数据集是使用wdumper工具生成的Wikidata英文歌曲RDF转储数据，包含4个文件，涵盖配置信息、规格说明、压缩数据和预览数据，可用于获取Wikidata中与英文歌曲相关的结构化语义数据。文件详解文件名称：info.json 文件格式：JSON...

ZIP

Wikidata_BabelNet01_RDF数据

2026年1月31日

数据集概述本数据集是通过wdumps工具生成的Wikidata RDF转储数据，聚焦BabelNet相关陈述。包含4个文件，涵盖数据文件、配置文件和预览文件，提供Wikidata数据的结构化存储和查询支持。文件详解文件名称：info.json 文件格式：JSON...

ZIP

Wikidata_Dump_human_知识图谱RDF转储数据

2026年1月28日

数据集概述本数据集是使用wdumps工具生成的Wikidata人类相关数据的RDF转储，包含实体、陈述和三元组信息，共4个文件，涵盖JSON、压缩文件和NT格式，支持知识图谱相关研究与应用。文件详解文件名称：info.json 文件格式：JSON...

ZIP

Wikidata_RDF_Based语义数据转储文件

2026年1月31日

数据集概述本数据集是通过wdumps工具生成的Wikidata的RDF转储数据，包含实体、声明、三元组等语义数据相关内容。数据集包含4个文件，涵盖JSON配置文件、预览文件及压缩数据文件，可用于Wikidata语义数据的分析与处理。文件详解配置与信息文件文件名称：info.json 文件格式：JSON...