找到9个数据集

格式: ZIP 标签: TEI XML

过滤结果
  • CDL_Based_托斯卡纳伦巴第原始外交宪章及同期副本TEI_XML数据_公元714_774年

    2026年1月9日 30 166 77

    数据集概述 本数据集为《Codice diplomatico longobardo 1-2》的TEI XML版本,收录公元714至774年间托斯卡纳地区的原始伦巴第外交宪章及同期副本。数据由Luigi...
    packageimg
  • 霍夫日记_萨克森王位继承人约翰_乔治二世的宫廷记录_TEI_XML_转录数据_1653_1656年

    2026年1月7日 30 84 18

    数据集概述 本数据集为萨克森选帝侯Johann Georg II.(1653-1656年任王储时期)宫廷日记手稿的TEI:XML转录版本,记录其父Johann Georg I.最后三年统治期间的权力交接过程。转录经Transkribus行分割、scriptorium模型训练、LLM校正及人工核验,遵循DTABf-M规范,含日期、人物、地点等结构化标记。...
    packageimg
  • Codice_diplomatico_toscano_托斯卡纳775_813年原始宪章TEI_XML数据

    2026年1月1日 30 163 62

    数据集概述 本数据集为《Codice diplomatico toscano 2:1》的TEI XML版本,收录公元775至813年间托斯卡纳地区的原始宪章及同期副本。数据保留了与形态句法分析相关的缩写扩展、脱漏标注等外交信息,添加ChLA编号以便与摹本对比,且经Timo Korkiakangas修正。数据集含一个XML文件,无目录结构。 文件详解...
    packageimg
  • TEI_XML_Based_萨克森选帝侯约翰_格奥尔格二世1665年宫廷日记完整转录数据_Release2

    2025年12月30日 30 186 114

    数据集概述 本数据集包含1665年萨克森选帝侯约翰·格奥尔格二世宫廷日记(SLUB Mscr.Dresd.K.80)的完整手写转录版本,遵循DTABF标准提供TEI:XML格式文件及PDF阅读版。XML文件通过元素拆分日记条目,标注日期、人物、地点及格式元素,PDF由TEIGarage简单转换生成,未优化排版。 文件详解 文件名称:SLUB Dresd...
    packageimg
  • 悉昙碑铭档案_EpiDoc格式文本

    2025年12月12日 30 32 20

    数据集概述 本数据集是悉昙语料库中碑铭文本的EpiDoc(TEI XML)版本归档,包含不同时间点的工作进展版本与最终发布版本,记录了碑铭文本的数字化编辑过程,为碑铭研究提供结构化的文本数据支持。 文件详解 该数据集以版本为单位归档EpiDoc格式的碑铭文本文件,各版本说明如下: -...
    packageimg
  • 欧洲文学文本语料库英文小说数据集2021

    2025年12月14日 30 42 20

    数据集概述 该数据集是欧洲文学文本语料库(ELTeC)的英文小说部分,2021年4月发布,包含100部英文小说的TEI XML源文件,由COST Action项目构建,为欧洲文学远程阅读研究提供支持。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容:...
    packageimg
  • Jarāʾid阿拉伯期刊年表数据集1800_1929

    2025年12月7日 30 109 2

    数据集概述 该数据集是Jarāʾid项目首次发布的文献数据,收录了1800至1929年全球范围内以阿拉伯语(含阿拉伯语加其他语言)出版的所有期刊的文献信息,是项目网站的基础数据支撑。 文件详解 文件名称:ProjectJaraid/jaraid_source-v1.0.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • ELTE_Poetry_Corpus_Based_匈牙利经典诗歌多维度特征标注完整数据

    2025年12月6日 30 82 81

    数据集概述 该数据集为ELTE诗歌语料库,包含匈牙利53位经典诗人的14358首完整诗歌,涵盖词汇语法特征、押韵模式、节奏、头韵等诗歌声音特征,以TEI及非TEI XML格式存储,为诗歌研究提供结构化标注数据。 文件详解 文件名称:poetry-corpus-1.0.zip 文件格式:ZIP压缩包 内部目录及内容: level1:人工校验的TEI...
    packageimg
  • 数据17世纪苏黎世Stillstand会议记录TEI_XML数据集

    2025年12月5日 30 179 84

    数据集概述 本数据集包含17世纪瑞士苏黎世地区Stillstand会议记录的TEI-XML格式数字化文本,记录了当地宗教社区管理机构Stillstand的日常事务、社会治理及民众生活等内容,由原始手写记录转录、转换而来,具有重要历史文献价值。 文件详解 核心数据文件:...
    packageimg