葡萄牙语发票收据图像及字段标注数据集

数据集概述

该数据集包含八百一十三张葡萄牙语的私人公司发票与收据图像,以及对应文本文件,记录了销售方名称、地址、税号、购买方税号、发票日期、总金额、税额和文档编号等关键字段的转录信息。

文件详解

  • 1_Images.zip:压缩文件,包含所有发票与收据的图像文件,格式未提及。
  • 2_Annotations_Json.zip:压缩文件,包含各文档相关字段的转录文本文件,格式为JSON。字段包括销售方名称、销售方地址、销售方税号、购买方税号、发票日期、发票总金额、发票税额、文档编号。

适用场景

  • 文档信息抽取研究:可用于训练和测试发票、收据关键信息自动提取模型。
  • 光学字符识别(OCR)优化:针对葡萄牙语文本的OCR技术性能提升。
  • 财务自动化应用:支持企业财务数据录入、报销审核等场景的自动化解决方案开发。
  • 多语言文档处理:探索葡萄牙语商业文档处理的算法与工具。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 391.5 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。