TI-OCR数据集

TI-OCR数据集 数据来源:互联网公开数据 标签:OCR,图像识别,文本识别,性能评估,测试数据集,人工标注,Kaggle 数据概述: 本数据集包含从互联网抓取的30张测试图像,图像格式为.jpg或.png,每张图像包含不同背景、对比度、字体大小和颜色的文本,以增加数据集的多样性。数据集还包含一个.csv文件,其中包含每张测试图像的手动标注文本,与图像中的文本一致。该数据集已开源至Kaggle,供进一步使用。 数据用途概述: 该数据集适用于评估两个或多个OCR流水线的性能。通过使用相同的测试图像进行比较,可以消除输入图像质量对结果的影响,从而准确比较不同OCR流水线的效率。此外,该数据集还适用于OCR技术的研究和开发,帮助研究人员和开发人员改进OCR算法的准确性和鲁棒性。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.29 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。