找到56个数据集

标签: 光学字符识别

过滤结果
  • Gado2_Based_荷属东印度群岛多语言报纸手写文本识别标注数据集

    2026年1月26日 30 131 39

    数据集概述 本数据集包含Gado2命名实体处理应用的手写文本识别(HTR)标注数据,覆盖荷属东印度群岛及印度尼西亚的多语言报纸。因扫描质量问题,光学字符识别(OCR)错误率较高,而HTR将字符错误率(CER)降至0.5%以下,提升了命名实体识别(NER)效率。数据集含41个文件,包括无错误的全标注文件及印尼实体知识库。 文件详解...
    packageimg
  • Newspaper_Navigator_Based_19世纪美国报纸广告图像标注数据集

    2026年1月14日 30 133 53

    数据集概述 本数据集包含19世纪美国报纸广告图像及“带插图”或“无插图”标注,源自美国国会图书馆Chronicling America馆藏的Newspaper Navigator数据集。数据含广告图像文件及配套元数据、标签文件,旨在为历史数字资源的计算机视觉教学提供实例,可用于广告图像分类研究。 文件详解 images.zip 文件格式:ZIP...
    packageimg
  • 文档超分辨率任务专用精选文本聚焦DocLayNet子集

    2025年12月23日 30 172 161

    数据集概述 本数据集是基于DocLayNet数据集精选的子集,专注于文本类文档的超分辨率与恢复任务。数据包含高分辨率(HR)和低分辨率(LR)成对图像,按训练、验证、测试集划分,支持有监督学习研究。 文件详解 文件名称:Dataset.zip 文件格式:ZIP压缩包...
    packageimg
  • floodX原始数据_元数据与预处理代码

    2025年12月20日 30 57 7

    数据集概述 本数据集包含floodX实验的原始文本格式数据、元数据及预处理代码,分为metadata、data_raw、code、data_ocr_result四个子文件夹,为洪水实验数据的可视化和建模提供支持。需注意流速数据存在系统性误差,绝对测量值不可用。 文件详解 该数据集为一个ZIP格式压缩包,包含以下子文件夹: -...
    packageimg
  • 塞维利亚古版书字符分割与识别数据集1494_1500

    2025年12月11日 30 8 1

    数据集概述 该数据集包含针对1494-1500年塞维利亚古版书(INC/901)的字符分割与光学字符识别模型,基于Kraken工具训练,含62页、5556行数据,字体类型为97G,分割符合SegmOnto词汇标准。 文件详解 文件名称: inc_901_zenodo.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 婴儿用品安全数据集

    2025年6月4日 30 179 137

    婴儿用品安全数据集 数据来源:互联网公开数据 标签:产品分类,品牌识别,图像处理,光学字符识别,Deep Learning,无监督学习,婴儿用品 数据概述:...
    packageimg
  • 医疗患者社保号码识别数据集MedicalPatientSocialSecurityNumberRecognitionDataset-chaosmvptr

    2025年5月30日 30 180 137

    医疗患者社保号码识别数据集MedicalPatientSocialSecurityNumberRecognitionDataset-chaosmvptr 数据来源:互联网公开数据 标签:医疗影像, 图像识别, 光学字符识别, 社保号码, 数据标注, 文本提取, 机器学习, 隐私保护 数据概述:...
    packageimg
  • 医疗文档社保号码提取数据集MedicalDocumentSocialSecurityNumberExtractionDataset-chaosmvptr

    2025年5月30日 30 152 21

    医疗文档社保号码提取数据集MedicalDocumentSocialSecurityNumberExtractionDataset-chaosmvptr 数据来源:互联网公开数据 标签:光学字符识别, OCR, 图像处理, 社保号码, 文本识别, 数据标注, 医疗影像, 信息提取 数据概述:...
    packageimg
  • 光学字符识别英文文本标注数据集OpticalCharacterRecognitionEnglishTextAnnotationDataset-sardararslan

    2025年5月30日 30 168 15

    光学字符识别英文文本标注数据集OpticalCharacterRecognitionEnglishTextAnnotationDataset-sardararslan 数据来源:互联网公开数据 标签:光学字符识别, OCR, 文本识别, 图像处理, 深度学习, 数据集, 文本标注, 自然语言处理 数据概述:...
    packageimg
  • OCR文字识别训练数据集OCRCRNNTrainWordSplit250-600Dataset-aditya08

    2025年5月30日 30 15 13

    OCR文字识别训练数据集OCRCRNNTrainWordSplit250-600Dataset-aditya08 数据来源:互联网公开数据 标签:光学字符识别,文字识别,数据集,深度学习,计算机视觉,自然语言处理,图像处理,机器学习 数据概述:...
    packageimg
  • 文档图像识别与光学字符识别数据集DCICOCRDocumentImageRecognitionDataset-panfei748

    2025年5月30日 30 76 40

    文档图像识别与光学字符识别数据集DCICOCRDocumentImageRecognitionDataset-panfei748 数据来源:互联网公开数据 标签:文档识别,光学字符识别,数据集,图像处理,机器学习,自然语言处理,计算机视觉,人工智能 数据概述: 该数据集由文档图像识别与光学字符识别竞赛(DCIC...
    packageimg
  • 支票光学字符识别数据集OCR-leoniloris

    2025年5月30日 30 12 5

    支票光学字符识别数据集OCR-leoniloris 数据来源:互联网公开数据 标签:光学字符识别,OCR,支票,图像处理,数据集,机器学习,文本识别,金融科技 数据概述: 该数据集包含了支票的图像数据,用于训练和评估光学字符识别(OCR)系统在支票上的表现。主要特征如下: 时间跨度:数据记录的时间跨度不限。 地理范围:数据来自不同地区和银行的支票。...
    packageimg
  • 中文OCR识别数据集-jianse

    2025年5月29日 30 78 35

    中文OCR识别数据集-jianse 数据来源:互联网公开数据 标签:OCR,光学字符识别,数据集,图像处理,深度学习,文本识别,中文,自然语言处理 数据概述:该数据集包含用于中文OCR(光学字符识别)任务的图像和对应的文本标注数据。主要特征如下: 时间跨度:数据集涵盖了不同时间段的中文文本图像。...
    packageimg
  • 阿拉伯字母和数字印刷体数据集ArabicLettersandDigitsPrintedDataset-samfathy74

    2025年5月29日 30 163 3

    阿拉伯字母和数字印刷体数据集ArabicLettersandDigitsPrintedDataset-samfathy74 数据来源:互联网公开数据 标签:阿拉伯字母,数字识别,数据集,图像分类,机器学习,光学字符识别,计算机视觉,模式识别 数据概述: 该数据集包含阿拉伯字母和数字的印刷体图像,记录了阿拉伯字母和数字的视觉特征。主要特征如下:...
    packageimg
  • 波斯字母图像数据集PersianAlphabetImagesDataset-mostafamohammadi1

    2025年5月29日 30 163 37

    波斯字母图像数据集PersianAlphabetImagesDataset-mostafamohammadi1 数据来源:互联网公开数据 标签:图像识别,数据集,机器学习,光学字符识别,人工智能,计算机视觉,字母识别,多语言处理 数据概述: 该数据集包含来自公开来源的波斯字母图像数据,记录了波斯语字母的视觉表示。主要特征如下:...
    packageimg
  • 英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn

    2025年5月29日 30 70 52

    英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn 数据来源:互联网公开数据 标签:光学字符识别,文本处理,数据集,自然语言处理,机器学习,英语语言,标点符号,计算机视觉 数据概述: 该数据集专注于英国英语中的标点符号光学字符识别(OCR),记录了各种文档中的标点符号及其识别结果。主要特征如下:...
    packageimg
  • 文档图像识别与分析数据集IMG6-40kDocumentRecognitionandAnalysisDataset-pradeepsiva

    2025年5月28日 30 180 162

    文档图像识别与分析数据集IMG6-40kDocumentRecognitionandAnalysisDataset-pradeepsiva 数据来源:互联网公开数据 标签:文档图像,图像处理,数据集,光学字符识别,机器学习,数据挖掘,人工智能,计算机视觉 数据概述: 该数据集包含来自多种文档图像的数据,记录了各种文档的图像信息。主要特征如下:...
    packageimg
  • 手写文本识别数据集KalapaHandwrittenTextRecognitionDataset-ctvmnn

    2025年5月28日 30 143 43

    手写文本识别数据集KalapaHandwrittenTextRecognitionDataset-ctvmnn 数据来源:互联网公开数据 标签:手写识别,文本识别,数据集,光学字符识别,机器学习,模式识别,计算机视觉,人工智能 数据概述: 该数据集包含来自Kalapa项目的手写文本数据,专注于手写文本的识别和转录。主要特征如下:...
    packageimg
  • 泰语光学字符识别数据集OCRThaiDataset-kontheeboonmeeprakob

    2025年5月28日 30 108 81

    泰语光学字符识别数据集OCRThaiDataset-kontheeboonmeeprakob 数据来源:互联网公开数据 标签:光学字符识别,OCR,泰语,数据集,自然语言处理,图像识别,机器学习,文本分析 数据概述: 该数据集包含用于泰语光学字符识别(OCR)任务的图像数据,记录了泰语文字的图像及其对应的文本。主要特征如下:...
    packageimg
  • 微软OCR图像尺寸调整数据集MicrosoftOCRImageResizeDataset-mostafaatta222

    2025年5月28日 30 204 142

    微软OCR图像尺寸调整数据集MicrosoftOCRImageResizeDataset-mostafaatta222 数据来源:互联网公开数据 标签:光学字符识别,图像处理,数据集,图像尺寸调整,文本识别,机器学习,计算机视觉,图像增强 数据概述:...
    packageimg