-
ICPR_2020文本块分割竞赛新闻眼数据集
2026年2月9日 30 8 7
数据集概述 本数据集为ICPR 2020文本块分割竞赛专用数据,源自NewsEye项目,包含奥地利国家图书馆提供的19至20世纪德语历史报纸页面(部分二值化),涉及4种报纸标题。数据分为简单赛道(仅连续文本)和复杂赛道(含表格、图像等),各赛道含训练数据40页、测试数据10页,总计6个压缩文件。 文件详解 训练数据文件...
-
mesmerize_core_Based_测试真值数据
2026年1月30日 30 112 52
数据集概述 本数据集为mesmerize-core软件测试提供真值数据,主要用于验证CNMF和CNMFE的"ixs tests"功能。当前版本已修复相关掩码的重塑问题,确保测试准确性。数据集包含一个压缩文件,适用于软件开发测试场景。 文件详解 文件名称:ground_truths.zip 文件格式:ZIP...
-
IPIN_2023_竞赛第三赛道_基于智能手机的远程数据集
2026年1月30日 30 88 51
数据集概述 本数据集包含IPIN 2023竞赛第三赛道(智能手机离站定位)的数据集及辅助材料,涵盖技术附件、训练/测试日志文件、补充工具材料及评估脚本与真值数据,用于支持该竞赛相关的定位算法研究与验证。 文件详解 Track-3_TA-2023.pdf 文件格式:PDF 内容介绍:竞赛技术附件(版本2),描述第三赛道的竞赛规则、任务要求及技术细节 01...
-
基于柏林国家图书馆历史报纸的OCR_OLR系统训练与评估真实数据集
2026年1月27日 30 133 14
数据集概述 本数据集包含柏林国家图书馆50页数字化历史报纸的真值数据,用于OCR/OLR系统的训练与评估,由欧盟ICT-PSP项目Europeana Newspapers产出。数据集含PAGE-XML格式真值文件、全分辨率及二值化扫描图像、对应OCR结果等5个压缩包,为历史报纸文本识别技术提供标准化测试资源。 文件详解 gt_page.zip...
-
IPIN_Based_2019竞赛Track3智能手机离站定位数据集及支持材料
2026年1月19日 30 148 45
数据集概述 本数据集包含IPIN 2019竞赛(意大利比萨)Track3(智能手机离站定位)的数据集及支持材料,涵盖竞赛规则、技术附件、训练/验证/评估日志文件、解析工具、地图、可视化材料及评估脚本与真值数据,用于支持该竞赛相关的研究与分析。 文件详解 竞赛文档类 文件名称:IPIN2019_Call4Competition...
-
Pracalit_OCR_Based梵语与纽瓦手稿OCR模型真值数据_持续更新
2026年1月20日 30 194 88
数据集概述 本数据集为Pracalit字体梵语与纽瓦手稿OCR模型的真值数据,包含PNG和XML文件,将持续更新。基于四份尼泊尔手稿的Pracalit Unicode转录文本创建,用于训练Transkribus平台的PyLaia模型,涵盖16至19世纪的梵语与纽瓦语手稿,支持古文字OCR模型的开发与优化。 文件详解...
-
圣加仑智能工厂传感器数据用于半自动化流程级别活动检测与评估_2023年4月11日
2026年1月19日 30 30 26
数据集概述 本数据集包含瑞士圣加仑大学智能工厂模型采集的传感器与过程数据,用于评估半自动化过程活动检测方法。数据来自Fischertechnik Industry 9.0V模型,通过Camunda平台控制生产与存储流程,以10Hz频率采集传感器数据,配套提供BPMN流程模型与Camunda事件日志,共6个文件,支持过程级活动检测的训练与测试验证。...
-
Transkribus_Based_约翰_克里索斯托姆讲道手稿列表及人工转录数据_V1_2
2026年1月13日 30 46 23
数据集概述 本数据集包含用于Transkribus手写文本识别(HTR)训练实验的约翰·克里索斯托姆《提多书讲道》手稿列表及人工转录样本。手稿年代为10至14世纪,数据集提供CSV格式的手稿清单及TEI标准格式的XML人工转录文件,支持HTR模型训练的基础数据需求。 文件详解 文件名称:sample_dataset-chrysostomus-...
-
GatorSense_MUUFLGulfport_Based_多源遥感数据初始发布_Release_01
2026年1月1日 30 21 2
数据集概述 本数据集为GatorSense/MUUFLGulfport的初始版本(Release 01),包含高光谱、激光雷达、地面光谱、实验室光谱、评分代码,以及布设目标和地物覆盖类别的真值数据,是一套整合多源信息的遥感数据集。 文件详解 文件名称:GatorSense/MUUFLGulfport-v0.1.zip 文件格式:ZIP...
-
IPIN2016竞赛第三赛道数据集与辅助材料
2025年12月19日 30 124 92
数据集概述 本数据集包含2016年西班牙阿尔卡拉IPIN竞赛第三赛道(基于智能手机的场外定位)的相关数据及辅助材料,含训练与盲评日志文件、解析工具、地图、评估脚本及真值数据,用于智能手机室内定位竞赛研究。 文件详解 文档文件:...
-
BigGrams半监督HTML信息提取系统数据集
2025年12月15日 30 128 103
数据集概述 该数据集为BigGrams半监督HTML信息提取系统相关的参考数据集,包含从真实网站抓取的网页数据,以及对应网站的人工标注参考实例数据,用于支持半监督信息提取方法的研究与验证。 文件详解 数据集包含一个ZIP压缩文件,解压后包含两个主要文件夹,具体说明如下: - 压缩文件: bigrams-reference-data-...
-
子镜头分割评估标注数据集
2025年12月13日 30 54 39
数据集概述 本数据集包含33个单镜头视频的人工标注子镜头分割真值数据,用于评估运动驱动的用户生成视频细粒度时间分割方法,涵盖自有视频、业余视频及电影片段三类,共674个子镜头过渡。 文件详解 核心文件:...
-
Text2KGBench本体驱动文本生成知识图谱基准数据集
2025年12月13日 30 173 105
数据集概述 该数据集是用于评估语言模型在本体引导下从文本生成知识图谱能力的基准,包含Wikidata-TekGen(十个本体、一万三千四百七十四句)和DBpedia-WebNLG(十九个本体、四千八百六十句)两个子数据集,遵循本体约束提取文本事实。 文件详解 数据集以压缩包形式提供,内部结构及内容如下: - 压缩包文件:...
-
基于物联网的活动检测服务生成器原型与评估数据集
2025年12月10日 30 14 12
数据集概述 该数据集是物联网活动检测服务生成器原型的配套数据,包含智能工厂与智慧医疗两个场景的服务生成及评估文件。按功能分为服务生成与应用评估子文件夹,提供生成服务的Python脚本、物联网输入数据、专家标注、评估用物联网日志、真值数据及检测结果等,支持复现论文中的服务生成与评估流程。 文件详解...
-
PAN23多作者写作风格分析数据集
2025年12月7日 30 209 64
数据集概述 该数据集是PAN@CLEF2023多作者写作风格分析共享任务的专用数据,包含三个难度级别的文档集,用于训练和测试段落级风格变化检测算法,文档均为英文且风格变化仅发生在段落间。 文件详解 文件名称: pan23-multi-author-analysis.zip 文件格式: ZIP压缩包 包含内容:...
-
核桃断层X射线数据集
2025年12月6日 30 155 82
数据集概述 该数据集为核桃的开放式断层X射线数据,包含单个核桃二维切片的三种不同分辨率X射线正弦图、对应测量矩阵、原始测量正弦图,以及1200个投影的正弦图和高分辨率滤波反投影重建结果(作为真值),为断层成像研究提供多分辨率实验数据。 文件详解 文件名称: example.m,文件格式: .m,可能为示例代码文件 文件名称:...



