找到830个数据集

标签: 语义分析

过滤结果
  • 语义数据_Wikidata_RDF转储数据

    2026年2月1日 30 5 1

    数据集概述 本数据集是使用wdumps工具生成的Wikidata RDF转储数据,包含4个文件,涵盖配置说明、规格参数、预览数据和压缩数据四类内容,可用于获取Wikidata的结构化语义数据,支持语义网络相关研究与应用。 文件详解 info.json 文件格式:JSON...
    packageimg
  • NGI_Forward_语义社交网络编码数据

    2026年2月1日 30 175 9

    数据集概述 本数据集是欧盟下一代互联网倡议(NGI Forward项目)的一部分,包含民族志学者对专题在线对话的编码结果及语义社交网络数据。数据以原始形式呈现,已伪匿名化,可用于进一步探索和复现研究,旨在为欧洲机构提供以人为中心的未来互联网政策建议。 文件详解 annotations.csv(CSV格式)...
    packageimg
  • 荷兰传记门户_生物信息_关系抽取_标注数据集

    2026年2月1日 0 123 56

    数据集概述 本数据集为荷兰传记文本的人工标注关系抽取数据集,包含14类生物信息相关关系,如出生时间、居住地、亲属关系等。数据源自荷兰传记门户,包含测试集数据及说明文档,共2个文件,用于自然语言处理领域的关系抽取任务研究。 文件详解 README.md 文件格式:.md...
    packageimg
  • HITO_健康信息技术本体数据_24_11版本

    2026年2月1日 30 8 3

    数据集概述 本数据集为健康信息技术本体(HITO)相关数据,核心内容为HITO本体文件,用于医疗信息领域的标准化和语义整合,帮助规范健康信息技术相关概念的定义与关联。 文件详解 文件名称:hitontology/ontology-24.11.zip 文件格式:ZIP...
    packageimg
  • EOL_v3_Based_数据模型本体扩展数据

    2026年2月1日 30 195 71

    数据集概述 本数据集包含EOL v3数据模型的本体扩展文件,主要涉及媒体、测量、发生等维度的本体定义,部分文件需配合样式表使用。共含4个文件,支持生物多样性数据模型的扩展应用,可通过指定论坛获取多用途聚合数据。 文件详解 XML本体文件(3个)...
    packageimg
  • CT_Based_否定表达不同方式影响研究数据

    2026年2月1日 30 164 151

    数据集概述 本数据集围绕“否定表达不同方式的影响”展开,关联医学CT领域相关内容,包含1个压缩文件,无子目录结构,未划分训练/测试集、数据/标签集或原始/处理数据,可用于探索否定表达在医学CT场景中的应用影响。 文件详解 文件名称:The Effect of Different Ways for Expressing Negation.zip...
    packageimg
  • 开放实践中的AI隐喻与自我民族志反思_数据视角

    2026年2月1日 30 50 9

    数据集概述 本数据集包含两部分内容:一是AI隐喻及其来源的收集数据,二是《Open Praxis》期刊待发表AI隐喻相关文章作者的自民族志反思。数据集共2个文件,均为Excel格式,无目录层级,可用于AI隐喻研究与学术写作反思分析。 文件详解 数据文件1:...
    packageimg
  • 新约圣经地名数据_基于Louw_Nida语义域

    2026年2月1日 30 176 146

    数据集概述 本数据集源自Louw和Nida的《新约希腊语-英语词典》,包含新约圣经中出现的全部259个地理名称及其在《希腊新约》(SBL版)中的出现情况,为研究新约地理背景提供结构化数据支持。 文件详解 文件名称:newTestamentToponymsBasedOnLouwNidaSemanticDomains.xlsx 文件格式:XLSX...
    packageimg
  • 知识图谱数据处理_Wikidata厨房用品数据

    2026年2月1日 30 9 6

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储,聚焦于厨房用品子类。包含4个文件,涵盖元信息、转储规范、预览数据及压缩数据文件,记录实体、陈述和三元组计数等基础信息,为厨房用品领域的知识图谱研究提供结构化数据支持。 文件详解 元信息文件 文件名称:info.json 文件格式:JSON...
    packageimg
  • Sri_Lankan_分类广告匹配检索研究数据集

    2026年2月1日 30 19 7

    数据集概述 本数据集为斯里兰卡分类广告市场的广告匹配、语义检索及意图对齐研究开发,包含54489个广告对,来源覆盖五大平台,含人类验证真实样本与LLM生成样本。覆盖电子、车辆、房产三大类及20个子类,支持低资源子类别模型泛化训练评估。 文件详解...
    packageimg
  • 知识图谱_Wikidata_Q7561196数据

    2026年2月1日 30 165 138

    数据集概述 本数据集是通过wdumps工具生成的Wikidata实体Q7561196的非弃用RDF转储数据,包含实体、语句、三元组等语义网格式的结构化信息,共4个文件,覆盖JSON、压缩文件、N-Triples等格式,可用于知识图谱相关的语义分析与应用开发。 文件详解 核心文件列表 文件名称:info.json 文件格式:JSON...
    packageimg
  • dsfsi_Based非洲语言新闻语料库2022

    2026年2月1日 30 111 92

    数据集概述 本数据集为2022年的isiZulu新闻(含文章及标题)与Siswati新闻(仅标题)语料库,包含相关非洲语言的新闻文本资源,支持非洲语言的自然语言处理研究,数据集以单个压缩文件形式呈现。 文件详解 文件名称:dsfsi/za-isizulu-siswati-news-2022-v0.9.5.zip 文件格式:ZIP...
    packageimg
  • Wikidata_Based_RDF转储全量数据

    2026年2月1日 30 190 120

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据,包含实体、标签、描述、别名、站点链接、声明等知识图谱核心信息,以及数据生成工具的元数据记录。数据集共包含4个文件,涵盖配置、元数据、预览和压缩数据四种类型。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg
  • 基于民族主义保守主义变革语法的论文配套转录本数据

    2026年2月1日 30 201 66

    数据集概述 本数据集为论文"A nationalist-conservative grammar of change?"的配套转录本,包含MS Word格式(带行号)和RData格式文件,共18个文件。Word版本为行号参考基准,RData版本可用于配套可复现示例分析,涵盖民族保守主义相关文本内容,支持相关主题的文本研究。 文件详解 论文配套转录本文件...
    packageimg
  • PROV_Based_BFO本体映射数据2025

    2026年1月31日 0 92 80

    数据集概述 本数据集为PROV-to-BFO映射项目的2025年1月19日版本数据,是对PROV(PROV-O)与BFO(Basic Formal Ontology)本体映射关系的整理结果,通过GitHub仓库进行版本迭代,本次为该项目的更新版本,包含一个压缩文件。 文件详解 文件名称:PROV-to-BFO-v2025-01-19.zip...
    packageimg
  • S5_Data_Swahili匿名IDI转录本数据

    2026年1月31日 30 208 19

    数据集概述 本数据集为S5 Data,包含斯瓦希里语中所有IDI(个体深度访谈)转录本的匿名版本,这些转录本基于S4 Data进行分析,并选择性翻译用于结果部分的引用。数据集仅包含一个文件。 文件详解 文件名称:S5 Data. IDIs transcripts.docx 文件格式:DOCX...
    packageimg
  • Wikidata_Dump_人物数据RDF转储数据

    2026年1月31日 30 135 132

    数据集概述 本数据集是通过wdumps工具生成的Wikidata人物数据RDF转储,包含4个文件,涵盖信息描述、规格说明、预览数据和压缩数据等内容,可用于获取结构化的Wikidata人物相关数据。 文件详解 info.json 文件格式:JSON...
    packageimg
  • INOTAXA_Based_分类学资源整合访问数据

    2026年1月31日 30 83 29

    数据集概述 本数据集为INOTAXA平台相关的XML数据文件,INOTAXA是整合开放分类学访问的网络工作空间,可同时访问分类描述、鉴定密钥、目录、名称、标本数据、图像等资源。数据集包含1个XML文件,无目录结构,文件类型单一。 文件详解 文件名称:63.xml 文件格式:XML...
    packageimg
  • Wikidata_RDF_Based转储数据_ma

    2026年1月31日 30 111 65

    数据集概述 本数据集是通过wdumper工具生成的Wikidata的RDF格式转储数据,包含4个文件,涵盖信息描述、规范配置、预览数据及压缩数据等内容,实体数、陈述数、三元组数均为0,可用于了解Wikidata转储的文件结构与配置规范。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Wikidata_Dump_英文歌曲RDF转储数据

    2026年1月31日 30 107 38

    数据集概述 本数据集是使用wdumper工具生成的Wikidata英文歌曲RDF转储数据,包含4个文件,涵盖配置信息、规格说明、压缩数据和预览数据,可用于获取Wikidata中与英文歌曲相关的结构化语义数据。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg