数据集概述
本数据集是LinkedBooks项目的成果,包含威尼斯历史相关期刊(如《Ateneo Veneto》《Archvio Veneto》《Studi Veneziani》)和专著的参考文献列表及脚注参考文献标注数据。数据经数字化、OCR处理(使用ABBYY FineReader)和标注(使用Brat ADD),时间跨度为2014至2016年,同时提供基于条件随机场的解析器训练框架。
文件详解
- 文件名称:
dhlab-epfl/LinkedBooksReferenceParsing-1.1.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含威尼斯历史文献的参考文献标注数据(来自期刊脚注及专著参考文献列表),以及基于条件随机场的参考文献解析器训练框架;未检测到具体字段映射的公开预览信息。
数据来源
LinkedBooks项目(http://dhlab.epfl.ch/page-127959-en.html)
适用场景
- 历史文献数字化研究:用于分析威尼斯历史文献的参考文献结构与标注规范。
- 参考文献解析模型训练:利用提供的条件随机场框架,训练定制化的参考文献解析器。
- 学术文献计量分析:挖掘威尼斯历史研究领域的文献引用网络与学术影响力。
- 数字人文工具开发:为历史领域的数字人文项目提供参考文献处理的数据集与技术支撑。