Hofdiarium_1665_Based德累斯顿宫廷日记库兰特手写体基准数据集

数据集概述

本数据集为17世纪萨克森库兰特手写体的手写文本识别(HTR/OCR)基准数据集,包含《选帝侯约翰·格奥尔格二世1665年宫廷日记》(SLUB Mscr.Dresd.K.80)的10页(fol.85r-89v)基准数据,采用eScriptorium完成图像与文本对齐,提供多种格式文件及转录指南。

文件详解

  • 压缩包文件
  • 文件名称:Mscr.Dresd.K.80 GT Sample Set.zip
  • 文件格式:ZIP
  • 包含内容:ALTO格式文件、Page XML格式文件、完整转录文本文件(txt)、原始图像文件(jpg),文件按类型存储于对应命名的文件夹中

数据来源

萨克森州立与大学图书馆德累斯顿(SLUB Dresden)

适用场景

  • 手写文本识别模型训练与评估: 用于训练和测试针对17世纪萨克森库兰特手写体的HTR/OCR模型
  • 历史文献数字化研究: 为17世纪德语手写文献的数字化处理提供基准参考
  • 手写体识别技术优化: 分析库兰特手写体的特征,优化手写文本识别算法
  • 历史语言学研究: 基于基准转录文本,研究17世纪德语手写体的书写规范与语言特征
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 12.87 MiB
最后更新 2026年1月19日
创建于 2026年1月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。