找到3个数据集

标签: 编码文本

过滤结果
  • TEI编码数字版本通用处理与呈现数据集

    2025年12月18日 30 144 117

    数据集概述 本数据集为2014年TEI会员会议报告的基础资料,聚焦TEI编码数字版本的处理与呈现问题。通过分析现有编码文本的元素使用情况,探讨基于文本类型和编码目的实现通用呈现的可能性,为TEI文本互操作性研究提供数据支持。 文件详解 该数据集包含四类文件,具体说明如下: - HTML文件(共5个): -...
    packageimg
  • 西班牙语小说语料库2021_04

    2025年12月7日 30 43 13

    数据集概述 该数据集是2021年4月发布的西班牙语小说语料库(ELTeC-spa),包含八十三个按一级标准编码的小说。数据集由元数据文件、说明文档和压缩包组成,为欧洲文学文本研究提供结构化的西班牙语小说资源。 文件详解 metadata.csv(CSV格式):包含西班牙语小说的元数据信息,字段包括id(语料库编号)、author-...
    packageimg
  • 罗马尼亚小说语料库2021年4月版

    2025年12月4日 30 207 190

    数据集概述 该数据集是2021年4月发布的罗马尼亚小说语料库(ELTeC-rom),包含95部按第一层级编码的小说,提供了小说元数据、说明文档及压缩文件包,为欧洲文学文本相关研究提供基础数据支持。 文件详解 文件名称: metadata.csv 文件格式: CSV 字段映射: 包含id(编号)、author-name(作者名)、book-...
    packageimg