找到4个数据集

标签: XML语料库

过滤结果
  • TextGrid_CC_BY_3_0授权_XML格式语料库数据

    2026年1月28日 30 198 180

    数据集概述 本数据集为XML格式的文本语料库压缩包,所有文本源自TextGrid平台,由Katrin Dennerlein博士整理。语料库采用CC-BY 3.0协议授权,相关研究在《席勒-克莱斯特不确定性原理》中被提及,可用于计算机语言学或文本分析相关研究。 文件详解 文件名称:XML.zip 文件格式:ZIP(压缩包)...
    packageimg
  • XML_corpus_Based_文学文本XML语料库数据

    2026年1月30日 30 174 122

    数据集概述 本数据集为XML格式的文学文本语料库,包含席勒、莱辛、克莱斯特、歌德、蒂克等作家的作品,共56个XML文件,无目录层级结构,未划分训练/测试、数据/标签或原始/处理集,所有文件均为XML格式,其中5个含XML元数据。 文件详解 核心文件:...
    packageimg
  • KOnPoTe_Resources_船只与餐厅语义资源数据

    2026年1月30日 30 162 41

    数据集概述 本数据集包含KOnPoTe项目下与船只和餐厅相关的语义资源数据,涵盖本体结果、黄金标准、本体输入文件及语料库文件,共8个文件,主要用于自然语言处理领域的语义分析与本体构建相关研究。 文件详解 OWL文件(6个)...
    packageimg
  • KOnPoTe_Based_法语房产领域文本知识图谱构建实验评估数据

    2026年1月23日 30 120 78

    数据集概述 本数据集包含用于评估KOnPoTe(从文本中填充知识图谱/本体)方法的11个文件,覆盖法语房产销售领域。内容分为输入数据、黄金标准和输出结果三类,支持分析不同词形还原工具与方法对知识图谱构建的影响。 文件详解 输入文件(Inputs) 文件名称:biens_immobiliers.owl 文件格式:OWL...
    packageimg