-
CISA_Cyber_网络安全TTP文章数据集
2026年2月1日 30 203 102
数据集概述 本数据集包含从CISA官网爬取的77篇网络安全文章,发布时间为2020年7月至2024年2月,均明确提及MITRE ATT&CK TTPs。数据支持网络威胁情报领域研究,可作为TTP标注的基准数据,助力网络安全公告中TTP的识别与分类分析。 文件详解 数据集文件 文件名称:CISA-crawl-rt-ttp-ct.csv...
-
IAM_OnDB_Based_单词图像压缩包数据
2026年2月1日 30 185 172
数据集概述 本数据集为IAM-OnDB单词图像数据,核心内容为单词相关的图像资源,以压缩包形式提供,未包含训练/测试、数据/标签、原始/处理等划分,无额外说明文档或内容预览,便于自然语言处理领域相关研究使用。 文件详解 文件名称:IAM-OnDB_words.zip 文件格式:ZIP 字段映射介绍:为压缩包文件,包含IAM-...
-
IGN_ICDAR_25_历史地图文本识别竞赛训练及验证数据集
2026年1月28日 30 30 3
数据集概述 本数据集为ICDAR'25历史地图文本竞赛提供训练与验证数据,包含从Val de Marne档案馆拿破仑地籍地图裁剪的2K×2K图像切片,含训练集228张切片、验证集25张切片及对应标注文件,是2024版数据集的扩展与优化版本。 文件详解 训练集文件 文件名称:ign25_train.zip、ign25_train.json...
-
Tesseract_Based_阿尔萨斯方言OCR训练模型数据集
2026年1月28日 30 203 72
数据集概述 本数据集包含为阿尔萨斯方言开发的两个Tesseract OCR训练模型,由法国ANR资助的RESTAURE项目生成。模型分别针对Tesseract 3.0x和4.0x版本训练,基于不同训练文本和方法构建,配套字典数据来自多类阿尔萨斯语料库与词典,可用于阿尔萨斯方言文本的光学字符识别。 文件详解 ISKO_2015.zip 文件格式:ZIP...
-
基于柏林国家图书馆历史报纸的OCR_OLR系统训练与评估真实数据集
2026年1月27日 30 143 87
数据集概述 本数据集包含柏林国家图书馆50页数字化历史报纸的真值数据,用于OCR/OLR系统的训练与评估,由欧盟ICT-PSP项目Europeana Newspapers产出。数据集含PAGE-XML格式真值文件、全分辨率及二值化扫描图像、对应OCR结果等5个压缩包,为历史报纸文本识别技术提供标准化测试资源。 文件详解 gt_page.zip...
-
Okralact_Tesseract_Based_OCR引擎训练模型数据
2026年1月22日 30 14 0
数据集概述 本数据集为基于Okralact训练的Tesseract OCR引擎模型,包含模型文件与元数据文件,字符错误率为1.24%。数据集共2个文件,无目录层级,主要文件类型为ZIP压缩包和JSON,可用于OCR识别相关的模型部署与性能分析。 文件详解 metadata.json 文件格式:JSON...
-
Parallel_Recognizer_Regular_Texts_并行识别器复现数据
2026年1月14日 30 9 5
数据集概述 本数据集为论文《Minimizing speculation overhead in a parallel recognizer for regular texts》的复现数据,包含2个文件,无目录层级。核心内容是用于复现正则文本并行识别器实验结果的程序与数据,支持研究人员验证并行识别器的性能优化效果。 文件详解...
-
Noscemus_Transkribus_Based_早期现代拉丁印刷品机器可读文本数据
2026年1月13日 30 209 197
数据集概述 本数据集包含从Noscemus Wiki收录的作品数字副本中提取的纯文本,通过Transkribus工具转换为机器可读格式。文本通过Transkribus ID相互关联,每个数字副本的来源均有记录。转录文本由NOSCEMUS项目训练的早期现代拉丁印刷品识别模型自动生成,未经过人工编辑或校正,共包含1个文件。 文件详解...
-
KWS_400_Occupational_titles_Manisa_dataset_历史档案样本数据
2026年1月2日 30 34 29
数据集概述 本数据集包含从土耳其共和国总统国家档案馆奥斯曼档案部的奥斯曼人口登记册(NFS.d. 2865、2866、2867)中提取的样本材料,属于1843年1月31日(伊斯兰历1258年12月29日)马尼萨市的档案。数据集提供了400个职业头衔图像,分为两种格式,涵盖40种最常见的职业,每种职业各10个样本。 文件详解...
-
德国伍珀塔尔埃尔伯费尔德莫伦药房历史档案1924_1948
2025年12月25日 30 50 1
数据集概述 该数据集包含德国伍珀塔尔埃尔伯费尔德莫伦药房的历史档案,主要为1924至1948年间的问卷、索引卡及部分公开附录材料,通过Kalliope门户网站编目,反映该药房的历史沿革。 文件详解 文件名称: 21427.pdf,文件格式: PDF,为文档类文件,内容涉及药房历史相关的问卷或附录材料 文件名称: 21427.tiff,文件格式:...
-
NewsEye_READ_AS_19世纪芬兰报纸训练数据集
2025年12月24日 30 62 0
数据集概述 该数据集包含19世纪芬兰报纸页面的带注释文本数据,共200页训练集页面图像由芬兰国家图书馆(NLF)提供,数据按PAGE格式构建,通过Transkribus平台生成,附带相关指南文档,为报纸文本识别模型训练提供支持。 文件详解 文件名称: Article GT guidelines for...
-
德国汉堡Hammonia药房历史档案数据集1924_1948
2025年12月23日 30 4 1
数据集概述 本数据集包含德国汉堡Hammonia药房的历史档案资料,主要为1924至1948年间的历史问卷、索引卡片及部分附属文件,记录了该药房的历史信息,由Kalliope门户网站编目。 文件详解 该数据集包含两个文件,具体说明如下: - 文件名称: 18810.pdf - 文件格式: PDF (.pdf) - 内容: 可能为药房历史相关的文档类档案...
-
德国Heilsbronn药房历史文献数据集1924_1947
2025年12月23日 30 118 69
数据集概述 该数据集包含1924至1947年间德国Heilsbronn药房的历史文献,包括历史问卷、索引卡片及部分附录材料,通过Kalliope门户编目,记录药房历史相关信息。 文件详解 18956.pdf:PDF格式文件,可能包含历史问卷或相关文档内容 18956.tiff:TIFF格式文件,可能为历史文献的图像扫描件 数据来源 Kalliope...
-
PAN12欺骗检测性捕食者识别数据集
2025年12月22日 30 13 1
数据集概述 本数据集为PAN 2012实验室“性捕食者识别”任务的训练语料库,该实验室与CLEF 2012会议同期举办,用于支持相关欺骗检测研究。 文件详解 文件名称: pan12-sexual-predator-identification-test-and-training.zip 文件格式: ZIP压缩包 内容说明:...
-
德国Cossebaude_Wettin药房历史文献集1924_1948
2025年12月22日 30 59 22
数据集概述 本数据集收录了德国Cossebaude Wettin药房的历史文献,包括1924年至1948年的历史问卷、索引卡片及部分精选附件,通过Kalliope门户网站进行编目,为研究该药房的历史发展提供原始资料支持。 文件详解 文件名称: 70501.tiff:TIFF格式文件,属于栅格图像文件,可能包含药房历史文献的扫描图像 文件名称:...
-
哈尔伯施塔特鼠药店历史文档集1924_1948
2025年12月21日 30 37 32
数据集概述 该数据集包含德国哈尔伯施塔特鼠药店的历史文档,主要为1924至1948年的调查问卷、索引卡片及部分公开附件,通过Kalliope门户编目,反映药店历史相关信息。 文件详解 18772.pdf:PDF格式文档文件,可能包含药店历史调查问卷或相关文本记录 18772.tiff:TIFF格式栅格文件,可能为历史文档的扫描图像 数据来源...
-
德国Bonnland药房历史档案数据集
2025年12月21日 30 156 122
数据集概述 本数据集包含与德国Bonnland药房历史相关的档案资料,主要为1924年和1948年的历史问卷、索引卡片及部分可公开的附属材料,通过Kalliope门户进行编目,反映该药房的历史背景。 文件详解 数据集包含两个文件,具体说明如下: - 文件名称: 49551.tiff - 文件格式: TIFF(.tiff) - 内容:...
-
自然灾害报告识别的3D词嵌入向量特征提取与混合CNNLSTM研究
2025年12月19日 30 198 40
数据集概述 本数据集包含一份关于自然灾害报告识别的研究文档,内容涉及3D词嵌入向量特征提取技术与混合CNNLSTM模型的应用,为相关领域的技术研究提供参考资料。 文件详解 文件名称:ID 26091.pdf 文件格式:PDF(.pdf) 文件内容:文档围绕自然灾害报告识别展开,涵盖3D词嵌入向量特征提取方法及混合CNNLSTM模型的技术内容 适用场景...
-
Kalliope_Germany_Pharmacy_Based_1924_1948历史档案完整数据
2025年12月18日 30 102 64
数据集概述 该数据集包含1924年至1948年德国一家药房(Glauchau Löwen-Apotheke)的历史档案,主要内容为历史问卷、索引卡及部分公开附录材料,通过Kalliope门户网站进行编目,反映药房历史相关信息。 文件详解 该数据集包含两个文件,具体说明如下: - 文件名称: 18604.tiff,文件格式:...
-
德国哈根_哈斯佩胡滕药房历史档案集1924_1948
2025年12月14日 30 137 6
数据集概述 该数据集包含德国哈根-哈斯佩胡滕药房的历史档案,主要为1924-1948年的历史问卷、索引卡片及部分公开附录材料,记录药房历史相关信息,通过Kalliope门户网站编目。 文件详解 文件名称:18761.tiff,文件格式:TIFF,为光栅图像文件,可能包含药房历史档案的扫描影像...



