找到3个数据集

标签: 人工转录

过滤结果
  • Lausanne_Based_19世纪人口普查手写文本识别训练数据集_2023版

    2026年1月15日 30 203 128

    数据集概述 本数据集包含三万四千九百一十三条人工转录的文本片段,用于历史文献(如人口普查表格)的手写文本识别训练。数据基于瑞士洛桑市1805至1898年的八十九页人口普查档案,主要语言为法语,含部分日耳曼姓名及地名。 文件详解 README.md 文件格式:MD 字段映射介绍:包含数据集作者、机构、发布日期、描述等元信息 Images.zip...
    packageimg
  • Transkribus_Based_约翰_克里索斯托姆讲道手稿列表及人工转录数据_V1_2

    2026年1月13日 30 15 9

    数据集概述 本数据集包含用于Transkribus手写文本识别(HTR)训练实验的约翰·克里索斯托姆《提多书讲道》手稿列表及人工转录样本。手稿年代为10至14世纪,数据集提供CSV格式的手稿清单及TEI标准格式的XML人工转录文件,支持HTR模型训练的基础数据需求。 文件详解 文件名称:sample_dataset-chrysostomus-...
    packageimg
  • MUSDB18_Lyrics_Based_多语言歌词扩展文本分析完整数据

    2025年12月15日 30 13 7

    数据集概述 本数据集是MUSDB18数据集的歌词标注扩展,包含九十八首训练集歌曲与四十五首测试集歌曲的英文歌词人工转录文本。歌词按三至十二秒自然停顿分段,部分有一秒重叠,提供词音素分解及辅助脚本,适用于文本辅助歌声分离等研究。 文件详解 README.txt: TXT格式,包含数据集说明、使用条款、引用要求、数据结构及文件说明等核心信息...
    packageimg