-
Okralact_Tesseract_Based_OCR引擎训练模型数据
2026年1月22日 30 62 17
数据集概述 本数据集为基于Okralact训练的Tesseract OCR引擎模型,包含模型文件与元数据文件,字符错误率为1.24%。数据集共2个文件,无目录层级,主要文件类型为ZIP压缩包和JSON,可用于OCR识别相关的模型部署与性能分析。 文件详解 metadata.json 文件格式:JSON...
-
Wayback_Based_1990年代末2000年代初中英文网页横幅广告数据集
2026年1月15日 30 207 187
数据集概述 本数据集包含1990年代末至2000年代初中英文网页上的22,915个独特横幅广告图像信息,数据从Wayback Machine存档的1,384,355个网页快照中提取,覆盖77,747个独特HTTP URL,URL来源于1999-2001年中美6本印刷互联网目录书籍,支持多学科研究。 文件详解...
-
SurveySet_OCR与OMR问卷数字化数据集
2025年12月20日 30 181 113
数据集概述 该数据集为SurveySet,是基于真实客户体验问卷构建的数据集,用于支持统一OCR-OMR模型的开发与评估。包含手写数字、勾选标记、叉号、部分填充气泡等文本与视觉输入类型,反映实体问卷的多样性与结构变异性。 文件详解 文件名称: SurveySet.zip 文件格式: ZIP压缩包 内容说明:...
-
阿尔马达_罗德里格斯家族历史文献综合分析系统数据集1877_1934
2025年12月18日 30 140 123
数据集概述 该数据集为阿尔马达·罗德里格斯家族1877-1934年历史文献的综合分析系统,包含OCR识别、系谱分析与统计验证功能,处理后文献达6.5σ验证水平与9.5/10质量,支持自动图像提取、系谱分析及LaTeX科学报告生成。 文件详解 文件名称: sistema_integrado_final_simple.zip 文件格式: .zip(压缩包)...
-
电子烟内容警告标签检测数据集
2025年12月11日 30 155 31
数据集概述 该数据集包含用于检测社交媒体平台(TikTok和YouTube)电子烟内容中警告标签的脚本与工作流程文档。核心内容围绕数据收集、视频处理、OCR识别、语言检测及规则分类器构建展开,为电子烟内容合规性分析提供技术实现框架。 文件详解 文件名称: Detecting-Warning-Labels-on-E-Cigarette-Content-...
-
英国维基百科图片OCR识别数据集UKWikipediaImageOCRRecognition-thnhhunhtn
2025年5月30日 30 183 130
英国维基百科图片OCR识别数据集UKWikipediaImageOCRRecognition-thnhhunhtn 数据来源:互联网公开数据 标签:OCR, 图像识别, 文本识别, 维基百科, 英国, 图像数据, 自然语言处理, 数据集 数据概述:...
-
商品图像尺寸与文本信息数据集ProductImageDimensionandTextInformationDataset-subhankarpanda56
2025年5月1日 30 118 98
商品图像尺寸与文本信息数据集ProductImageDimensionandTextInformationDataset-subhankarpanda56 数据来源:互联网公开数据 标签:商品图像, 尺寸信息, OCR识别, 图像分析, 文本提取, 电商数据, 机器学习, 计算机视觉 数据概述:...
-
商品图片信息OCR识别结果数据集ProductImageInformationOCRRecognitionResults-arushikabansal
2025年4月29日 30 172 109
商品图片信息OCR识别结果数据集ProductImageInformationOCRRecognitionResults-arushikabansal 数据来源:互联网公开数据 标签:OCR识别, 商品信息, 图像识别, 文本提取, 数据清洗, 零售行业, 深度学习, 文本分析 数据概述:...
-
电商商品信息识别与提取数据集CleanedShopeeDatawithOCRDataset-mohneesh7
2025年4月26日 30 176 95
电商商品信息识别与提取数据集CleanedShopeeDatawithOCRDataset-mohneesh7 数据来源:互联网公开数据 标签:电商数据,OCR识别,数据集,商品信息,图像处理,自然语言处理,机器学习,数据清洗...
-
微软OCR无缩放数据集MicrosoftOCRWithoutResizeDataset-mostafaatta222
2025年4月25日 30 192 79
微软OCR无缩放数据集MicrosoftOCRWithoutResizeDataset-mostafaatta222 数据来源:互联网公开数据 标签:OCR, 数据集, 文本识别, 机器学习, 图像处理, 自然语言处理, 文档分析, 软件工程 数据概述:...
-



