数据19世纪美国报纸照片预测图像数据集

数据集概述

该数据集包含从美国国会图书馆Chronicling America馆藏报纸中提取的图像,这些图像被预测为照片,并标注有“人类”“动物”“人类结构”“景观”四类标签,为历史报纸视觉内容的计算机视觉研究提供基础数据。

文件详解

  • 图像文件:
  • images.zip:ZIP格式压缩包,包含数据集中的所有图像文件
  • 元数据文件:
  • newspaper-navigator-sample-metadata.csv:CSV格式,包含图像的元数据字段,如文件路径、出版日期、页序号、地理覆盖范围、OCR文本等
  • 标签文件:
  • multi_label.csv:CSV格式,记录图像的多标签分类信息
  • annotations.csv:CSV格式,包含图像标签及额外元数据,字段包括批次、边界框、版次序号、文件路径、地理覆盖范围等
  • 结果文件:
  • results.csv:CSV格式,包含图像相关的处理结果数据
  • 任务文件:
  • photo_tasks.json:JSON格式,可能记录照片相关的任务信息

数据来源

Newspaper Navigator(news-navigator.labs.loc.gov/)

适用场景

  • 历史图像分析:研究19世纪美国报纸中的照片内容及主题分布
  • 计算机视觉教学:作为数字化 heritage 材料计算机视觉教学的示例数据集
  • 历史社会学研究:通过报纸照片标签分析特定历史时期的社会生活场景
  • 数字人文研究:探索历史视觉资料的自动分类与标注方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 846.34 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。