Okralact_Tesseract_Based_OCR引擎训练模型数据

数据集概述

本数据集为基于Okralact训练的Tesseract OCR引擎模型,包含模型文件与元数据文件,字符错误率为1.24%。数据集共2个文件,无目录层级,主要文件类型为ZIP压缩包和JSON,可用于OCR识别相关的模型部署与性能分析。

文件详解

  • metadata.json
  • 文件格式:JSON
  • 字段映射介绍:包含模型元数据,具体键值包括model(模型信息)、engine(引擎信息)、batch_size(批次大小)、model_prefix(模型前缀)、nepoch(训练轮次)、results(训练结果)
  • model.zip
  • 文件格式:ZIP
  • 字段映射介绍:Tesseract OCR引擎的训练模型压缩包,包含模型相关文件

适用场景

  • OCR引擎模型部署: 用于Tesseract OCR引擎的模型加载与文本识别应用
  • 模型性能评估: 基于元数据中的字符错误率等指标分析OCR模型的识别精度
  • 计算机视觉模型研究: 作为OCR模型训练的参考数据,探究训练数据对模型性能的影响
  • 文本识别应用开发: 为文档数字化、图像文字提取等OCR相关应用提供模型支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 64.46 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。