-
IGN_Based_ICDAR_24_MapText竞赛训练验证数据集
2026年1月26日 30 155 58
数据集概述 本数据集为ICDAR'24历史地图文本检测、识别与关联竞赛提供训练和验证数据,包含从Val de Marne档案馆拿破仑地籍图中裁剪的2Kx2K像素图像切片,配套标注文件遵循竞赛格式,可通过官方脚本评估,适用于历史地图文本相关算法开发与测试。 文件详解 训练集文件...
-
Shakespeare_His_Contemporaries_Based_早期现代戏剧共享唯一四元组数据
2026年1月1日 30 3 2
数据集概述 本数据集基于Martin Mueller的语料库《莎士比亚及其同代人》,记录了该时期仅在两部戏剧中共同出现的四元组(至少四个词的序列)信息。包含3个文件,核心内容为戏剧间共享四元组的关联数据,可用于分析早期现代戏剧的文本关联与作者风格特征。 文件详解 shcshareduniquetetragramsplus-sheet2.csv...
-
Magnetic_Margins_Based_文本语义分析与知识图谱数据
2025年12月14日 30 144 89
数据集概述 本数据集为Magnetic Margins项目的分析数据,包含文本注释、章节、副本的结构化CSV文件,以及描述文本变体、编辑修正的PDF文档,还提供RDF语义编码文件和知识图谱模型图,支持文本关联与语义分析。 文件详解 结构化数据文件(CSV格式):...



