找到859个数据集

标签: 语义分析

过滤结果
  • EOL_v3_Based_数据模型本体扩展数据

    2026年2月1日   

    数据集概述 本数据集包含EOL v3数据模型的本体扩展文件,主要涉及媒体、测量、发生等维度的本体定义,部分文件需配合样式表使用。共含4个文件,支持生物多样性数据模型的扩展应用,可通过指定论坛获取多用途聚合数据。 文件详解 XML本体文件(3个)...
    packageimg
  • CT_Based_否定表达不同方式影响研究数据

    2026年2月1日   

    数据集概述 本数据集围绕“否定表达不同方式的影响”展开,关联医学CT领域相关内容,包含1个压缩文件,无子目录结构,未划分训练/测试集、数据/标签集或原始/处理数据,可用于探索否定表达在医学CT场景中的应用影响。 文件详解 文件名称:The Effect of Different Ways for Expressing Negation.zip...
    packageimg
  • 开放实践中的AI隐喻与自我民族志反思_数据视角

    2026年2月1日   

    数据集概述 本数据集包含两部分内容:一是AI隐喻及其来源的收集数据,二是《Open Praxis》期刊待发表AI隐喻相关文章作者的自民族志反思。数据集共2个文件,均为Excel格式,无目录层级,可用于AI隐喻研究与学术写作反思分析。 文件详解 数据文件1:...
    packageimg
  • 新约圣经地名数据_基于Louw_Nida语义域

    2026年2月1日   

    数据集概述 本数据集源自Louw和Nida的《新约希腊语-英语词典》,包含新约圣经中出现的全部259个地理名称及其在《希腊新约》(SBL版)中的出现情况,为研究新约地理背景提供结构化数据支持。 文件详解 文件名称:newTestamentToponymsBasedOnLouwNidaSemanticDomains.xlsx 文件格式:XLSX...
    packageimg
  • 知识图谱数据处理_Wikidata厨房用品数据

    2026年2月1日   

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储,聚焦于厨房用品子类。包含4个文件,涵盖元信息、转储规范、预览数据及压缩数据文件,记录实体、陈述和三元组计数等基础信息,为厨房用品领域的知识图谱研究提供结构化数据支持。 文件详解 元信息文件 文件名称:info.json 文件格式:JSON...
    packageimg
  • Sri_Lankan_分类广告匹配检索研究数据集

    2026年2月1日   

    数据集概述 本数据集为斯里兰卡分类广告市场的广告匹配、语义检索及意图对齐研究开发,包含54489个广告对,来源覆盖五大平台,含人类验证真实样本与LLM生成样本。覆盖电子、车辆、房产三大类及20个子类,支持低资源子类别模型泛化训练评估。 文件详解...
    packageimg
  • 知识图谱_Wikidata_Q7561196数据

    2026年2月1日   

    数据集概述 本数据集是通过wdumps工具生成的Wikidata实体Q7561196的非弃用RDF转储数据,包含实体、语句、三元组等语义网格式的结构化信息,共4个文件,覆盖JSON、压缩文件、N-Triples等格式,可用于知识图谱相关的语义分析与应用开发。 文件详解 核心文件列表 文件名称:info.json 文件格式:JSON...
    packageimg
  • dsfsi_Based非洲语言新闻语料库2022

    2026年2月1日   

    数据集概述 本数据集为2022年的isiZulu新闻(含文章及标题)与Siswati新闻(仅标题)语料库,包含相关非洲语言的新闻文本资源,支持非洲语言的自然语言处理研究,数据集以单个压缩文件形式呈现。 文件详解 文件名称:dsfsi/za-isizulu-siswati-news-2022-v0.9.5.zip 文件格式:ZIP...
    packageimg
  • Wikidata_Based_RDF转储全量数据

    2026年2月1日   

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据,包含实体、标签、描述、别名、站点链接、声明等知识图谱核心信息,以及数据生成工具的元数据记录。数据集共包含4个文件,涵盖配置、元数据、预览和压缩数据四种类型。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg
  • 基于民族主义保守主义变革语法的论文配套转录本数据

    2026年2月1日   

    数据集概述 本数据集为论文"A nationalist-conservative grammar of change?"的配套转录本,包含MS Word格式(带行号)和RData格式文件,共18个文件。Word版本为行号参考基准,RData版本可用于配套可复现示例分析,涵盖民族保守主义相关文本内容,支持相关主题的文本研究。 文件详解 论文配套转录本文件...
    packageimg
  • S5_Data_Swahili匿名IDI转录本数据

    2026年1月31日   

    数据集概述 本数据集为S5 Data,包含斯瓦希里语中所有IDI(个体深度访谈)转录本的匿名版本,这些转录本基于S4 Data进行分析,并选择性翻译用于结果部分的引用。数据集仅包含一个文件。 文件详解 文件名称:S5 Data. IDIs transcripts.docx 文件格式:DOCX...
    packageimg
  • Wikidata_Dump_人物数据RDF转储数据

    2026年1月31日   

    数据集概述 本数据集是通过wdumps工具生成的Wikidata人物数据RDF转储,包含4个文件,涵盖信息描述、规格说明、预览数据和压缩数据等内容,可用于获取结构化的Wikidata人物相关数据。 文件详解 info.json 文件格式:JSON...
    packageimg
  • INOTAXA_Based_分类学资源整合访问数据

    2026年1月31日   

    数据集概述 本数据集为INOTAXA平台相关的XML数据文件,INOTAXA是整合开放分类学访问的网络工作空间,可同时访问分类描述、鉴定密钥、目录、名称、标本数据、图像等资源。数据集包含1个XML文件,无目录结构,文件类型单一。 文件详解 文件名称:63.xml 文件格式:XML...
    packageimg
  • Wikidata_RDF_Based转储数据_ma

    2026年1月31日   

    数据集概述 本数据集是通过wdumper工具生成的Wikidata的RDF格式转储数据,包含4个文件,涵盖信息描述、规范配置、预览数据及压缩数据等内容,实体数、陈述数、三元组数均为0,可用于了解Wikidata转储的文件结构与配置规范。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Wikidata_Dump_英文歌曲RDF转储数据

    2026年1月31日   

    数据集概述 本数据集是使用wdumper工具生成的Wikidata英文歌曲RDF转储数据,包含4个文件,涵盖配置信息、规格说明、压缩数据和预览数据,可用于获取Wikidata中与英文歌曲相关的结构化语义数据。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg
  • Wikidata_BabelNet01_RDF数据

    2026年1月31日   

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储数据,聚焦BabelNet相关陈述。包含4个文件,涵盖数据文件、配置文件和预览文件,提供Wikidata数据的结构化存储和查询支持。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg
  • Wikidata_Dump_human_知识图谱RDF转储数据

    2026年1月28日   

    数据集概述 本数据集是使用wdumps工具生成的Wikidata人类相关数据的RDF转储,包含实体、陈述和三元组信息,共4个文件,涵盖JSON、压缩文件和NT格式,支持知识图谱相关研究与应用。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg
  • Wikidata_RDF_Based语义数据转储文件

    2026年1月31日   

    数据集概述 本数据集是通过wdumps工具生成的Wikidata的RDF转储数据,包含实体、声明、三元组等语义数据相关内容。数据集包含4个文件,涵盖JSON配置文件、预览文件及压缩数据文件,可用于Wikidata语义数据的分析与处理。 文件详解 配置与信息文件 文件名称:info.json 文件格式:JSON...
    packageimg
  • Wikidata_Dump_dogs_RDF数据转储

    2026年1月31日   

    数据集概述 本数据集是Wikidata中与dogs相关的RDF数据转储,由wdumps工具生成。包含4个文件,涵盖数据规格、基本信息、预览数据及压缩数据,可用于知识图谱相关研究与应用。 文件详解 数据规格文件 文件名称:wdumper-spec.json 文件格式:JSON...
    packageimg
  • GRETIL_Based印度语言电子文本TEI数据集

    2026年1月31日   

    数据集概述 本数据集为GRETIL(哥廷根印度语言电子文本注册库)的TEI格式数据,包含一百零一份印度语言电子文本文件,均为XML格式,无目录层级划分,未进行训练测试、数据标签或原始处理数据的拆分,可用于印度语言文献的数字化研究与分析。 文件详解 数据文件 文件名称:包含sa_bAdarAyaNa-...
    packageimg