-
基于视觉的航天器场景神经网络表示合成数据集
2026年2月1日 30 140 88
数据集概述 本数据集是基于Unity 3D引擎生成的航天器合成图像数据集,包含CubeSat和SMOS两种卫星模型的图像及元数据。通过可控环境生成大量标注数据,解决真实空间数据稀缺问题,支持航天器视觉神经场景表示学习算法的训练与评估。 文件详解 文件名称:Dataset.zip 文件格式:ZIP...
-
TopiOCQA_Based_问答处理数据集
2026年2月1日 30 131 45
数据集概述 本数据集为TopiOCQA项目的处理数据集,包含18个文件,涉及训练集和验证集数据,涵盖黄金段落信息、检索器数据等内容,支持问答系统相关研究与实验,文件格式以JSON和CSV为主。 文件详解 黄金段落信息文件 目录路径:data/gold_passages_info/...
-
葡萄园植物健康检测标注数据集_2023_24年
2026年2月1日 30 109 71
数据集概述 本数据集包含508张用于葡萄园植物健康状态识别的标注图像,图像从2023-2024年不同日期的DJI Mavic无人机航拍照片中随机选取,涵盖植物生长的多个阶段。数据分为健康、霉菌感染、缺铁三种状态类别,采用YOLOv12格式标注,适用于模型训练与评估。 文件详解 数据集压缩包 文件名称:dataset.zip 文件格式:ZIP...
-
-
CNN_Based_浮游生物图像自动分析数据集与代码
2026年1月31日 30 126 82
数据集概述 本数据集包含基于卷积神经网络(CNN)的浮游生物图像自动分析相关的训练库、测试集、验证集及配套脚本程序,来自Luo等人发表于《Limnology and Oceanography Methods》的研究。数据支持浮游生物图像的分类模型训练、阈值过滤设置及混淆矩阵计算,共含9个文件。 文件详解 训练库...
-
PAN25_Based_多作者写作风格变化检测数据集
2026年1月31日 30 205 59
数据集概述 本数据集为PAN@CLEF2025共享任务“多作者写作风格分析”专用数据,核心任务是检测多作者文档中句子级的写作风格变化位置。数据集包含易、中、难三个难度等级,分别对应不同主题多样性的文档,各等级均划分训练、验证、测试集。 文件详解 文件名称:pan25-multi-author-analysis.zip 文件格式:ZIP...
-
-
Rooftop_Based_屋顶排水口与通风口检测标注数据集
2026年1月29日 30 89 21
数据集概述 本数据集为平屋顶排水口与通风口检测任务的标注数据,基于德国波恩市7.5厘米地面采样距离的高分辨率正射航拍影像,通过CVAT工具手动标注生成,包含740组屋顶影像与对应标注掩码对,按80%/10%/10%随机分为训练、验证和测试集,支持目标检测、语义分割等计算机视觉任务。 文件详解 数据集文件 文件名称:dataset_COCO.zip...
-
ACL_cite_Based_学术句子引用价值预测标注数据集
2026年1月29日 30 152 85
数据集概述 本数据集为NAACL 2021论文配套的ACL-cite数据集,包含从ACL Anthology学术文献中提取的270余万句学术文本,及对应句子是否需要引用的标注标签,用于研究上下文对句子引用价值预测的作用。数据集含三个CSV文件,按文档ID划分训练、验证和测试集。 文件详解 压缩包文件 文件名称:ACL-cite.zip 文件格式:ZIP...
-
IGN_ICDAR_25_历史地图文本识别竞赛训练及验证数据集
2026年1月28日 30 66 62
数据集概述 本数据集为ICDAR'25历史地图文本竞赛提供训练与验证数据,包含从Val de Marne档案馆拿破仑地籍地图裁剪的2K×2K图像切片,含训练集228张切片、验证集25张切片及对应标注文件,是2024版数据集的扩展与优化版本。 文件详解 训练集文件 文件名称:ign25_train.zip、ign25_train.json...
-
ORKG_Based_开放研究知识图谱_模板推荐_内容推荐数据集
2026年1月28日 30 10 7
数据集概述 本数据集用于在开放研究知识图谱(ORKG)中实现基于内容的推荐系统,输入研究论文标题和摘要,推荐语义相关的现有模板。包含一个通用数据集、两种方法的训练集、监督方法验证集及两种方法的测试集,支持自然语言推理(NLI)和无监督推荐模型训练与评估。 文件详解 dataset.json(JSON格式) 包含templates列表和neutral...
-
ScanBank_Based_扫描电子学位论文图表提取基准数据集
2026年1月28日 0 127 58
数据集概述 本数据集是用于从扫描电子学位论文中提取图表的基准数据集,包含标注文件、配置文件、代码文件等16个文件,支持图表提取任务的模型训练、验证与测试,为学术文档处理领域的图表检测研究提供标准化数据支撑。 文件详解 标注相关文件...
-
RASFF_Based_食品欺诈类型预测数据_2000_2014
2026年1月28日 30 116 108
数据集概述 本数据集基于欧盟食品饲料快速预警系统(RASFF)2000-2014年的食品欺诈通知信息构建,包含通知年份、产品类别、通知类型、通知国、原产地及欺诈类型等字段,用于通过贝叶斯网络模型预测食品欺诈类型,分为2000-2013年训练集和2014年验证集,共2个文件。 文件详解 文件名称:RASFF2000-2013-training.xlsx...
-
Metabolomics_Based_药物肝毒性评估与机制研究数据
2026年1月27日 30 173 160
数据集概述 本数据集基于代谢组学策略,通过非靶向质谱分析HepG2细胞在肝毒性与非肝毒性化合物作用下的代谢组变化,用于识别潜在肝毒性药物并揭示毒性机制。包含训练集(25种肝毒性、4种非肝毒性化合物)和验证集(69种已知毒性机制化合物、18种非肝毒性化合物)的相关数据,共2个文件。 文件详解...
-
MatTen_Based_10276种晶体DFT计算弹性张量数据集
2026年1月27日 30 55 38
数据集概述 本数据集包含10276种晶体的密度泛函理论(DFT)计算弹性张量数据,用于MatTen等变图神经网络模型开发。数据涵盖晶体结构、化学公式、弹性张量及不同晶体系统的相关参数,分为三个JSON文件,支持材料弹性特性研究与模型验证。 文件详解 crystal_elasticity_tensor.json 文件格式:JSON...
-
IGN_Based_ICDAR_24_MapText竞赛训练验证数据集
2026年1月26日 30 170 23
数据集概述 本数据集为ICDAR'24历史地图文本检测、识别与关联竞赛提供训练和验证数据,包含从Val de Marne档案馆拿破仑地籍图中裁剪的2Kx2K像素图像切片,配套标注文件遵循竞赛格式,可通过官方脚本评估,适用于历史地图文本相关算法开发与测试。 文件详解 训练集文件...
-
Cursive_Character_Based_王羲之草诀歌书法字符数据集
2026年1月21日 30 58 51
数据集概述 本数据集基于王羲之《草诀歌》的图像创建,包含九万九千二百九十六张图像样本,分为三百三十一个类别。数据按训练集、验证集、测试集划分,可用于书法字符识别、模式分析等相关研究。 文件详解 文件总数:3个 文件格式:.zip 文件列表: Training_set.zip:训练集压缩包,包含五万九千五百八十个数据样本...
-
IAM_Graph_Database_化学化合物HIV活性分类数据集
2026年1月25日 30 38 3
数据集概述 本数据集源自AIDS抗病毒筛选数据库的活性化合物,包含两千种化学化合物,部分为非连接结构。这些化合物按HIV活性分为训练集、验证集和测试集,用于支持图模式识别与机器学习模型的训练、参数优化及测试。 文件详解 压缩文件 文件名称:Fingerprint.zip、Letter.zip、AIDS.zip、Protein.zip、COIL-...
-
PAN24_CLEF2024_Based多作者写作风格变化检测数据集
2026年1月23日 30 94 49
数据集概述 本数据集为PAN@CLEF2024共享任务“多作者写作风格分析”的专用数据,包含三种难度(Easy、Medium、Hard)的英文文档,任务为段落级内在风格变化检测。数据集分为训练集、验证集和测试集,训练集和验证集含真实标签,测试集无标签,用于算法开发与评估。 文件详解 文件名称:pan24-multi-author-...
-
WD50K_Based_Wikidata超关系知识图谱数据集_2019
2026年1月22日 30 7 5
数据集概述 本数据集是基于2019年8月Wikidata RDF dump构建的超关系数据集,通过提取FB15K-237实体映射的种子节点及其带限定符的陈述,过滤字面量和低提及实体后划分训练、验证、测试集,再采样得到WD50K_33、WD50K_66、WD50K_100三个变体,分别对应不同比例的超关系事实。 文件详解 文件名称:WD50K.zip...



