-
京剧无伴奏清唱音节边界与时值标注zip文件
2026年2月1日 0 149 44
数据集概述 本数据集包含京剧专业及业余演唱者无伴奏演唱的音节边界标注与音节时长标注,是相关研究的实验数据。数据集整合了音频文件与标注文件,音频由C4DM Queen Mary University of London和MTG-UPF两所机构录制,标注采用Textgrid和CSV格式,同时提供解析代码。 文件详解...
-
葡萄园植物健康检测标注数据集_2023_24年
2026年2月1日 30 189 64
数据集概述 本数据集包含508张用于葡萄园植物健康状态识别的标注图像,图像从2023-2024年不同日期的DJI Mavic无人机航拍照片中随机选取,涵盖植物生长的多个阶段。数据分为健康、霉菌感染、缺铁三种状态类别,采用YOLOv12格式标注,适用于模型训练与评估。 文件详解 数据集压缩包 文件名称:dataset.zip 文件格式:ZIP...
-
QDSD_Based_量子点稳定性图实验数据_数据集
2026年1月31日 30 144 68
数据集概述 本数据集为量子点稳定性图数据集(QDSD),聚合了不同研究团队提供的量子点实验稳定性图数据,包含原始数据、处理后数据及标签文件,可用于离线调优或机器学习任务,目前仅标注了单量子点稳定性图数据。 文件详解 originals.zip 文件格式:ZIP 字段映射介绍:包含从实验人员处获取的原始数据,按来源分组,未经过任何数据处理...
-
DRIP_Based_软件需求文档段落需求提取数据集
2026年1月31日 30 203 21
数据集概述 本数据集为DRIP项目相关的软件需求文档数据集,包含近五年RE、ICSE、REFSQ、REJ会议及期刊的软件需求文档数据,共4个归档文件,用于从软件需求文档段落中提取单个需求的任务。 文件详解 训练数据文件 文件名称:trainData.gz 文件格式:.gz 字段映射介绍:未提供具体字段信息 标注数据文件 文件名称:annotation...
-
MAST_rhythm_重新标注子集_音乐节奏评估数据
2026年1月31日 30 198 39
数据集概述 本数据集是MAST节奏数据集的子集,包含80个学生节奏表演(对应20个参考音频)的重新标注数据。标注者通过自定义工具对表演进行评分,评分等级分为4(完美)、3(小错误)、2(大错误)、1(完全偏离),旨在为音乐节奏评估提供结构化标注参考。 文件详解 压缩包文件 文件名称:mast_rhythm_reannotated_subset.zip...
-
矿业_酷刑_缩写_科学文献_数据集_2024年10月28日
2026年1月29日 30 177 113
数据集概述 本数据集聚焦科学文献中的“扭曲缩写”挖掘,包含150篇开放获取的工程类文章,旨在识别学术文本中不规范的缩写现象,为检测可疑出版物提供支持。数据集含7个文件,涵盖数据档案、代码脚本、说明文档等多种类型。 文件详解...
-
FG_OVD_Based细粒度开放词汇目标检测基准套件数据
2026年1月29日 30 72 0
数据集概述 本数据集是FG-OVD细粒度开放词汇目标检测基准套件,包含PACO图像的标注数据,涵盖对象、部件及属性的自由格式细粒度文本描述,还包括多组负样本描述,用于测试开放词汇模型的细粒度识别能力,共含一个文件。 文件详解 压缩文件 文件名称:lorebianchi98/FG-OVD-v1.zip 文件格式:ZIP...
-
UISGD_Based_UI语义组检测标注数据集_部分发布版
2026年1月29日 30 188 50
数据集概述 本数据集是用于UI语义组检测的标注数据集,根据公司协议仅发布部分随机抽取的数据,包含100个样本和1个COCO格式的标注JSON文件,共2个文件,无训练/测试、数据/标签等拆分,可支持UI语义组检测相关研究与模型训练。 文件详解 UISGD.zip 文件格式:ZIP 内容说明:包含100个UI语义组检测的样本数据...
-
Zero_shot_Based_多语言应用评论挖掘标注数据集
2026年1月29日 30 136 76
数据集概述 本数据集包含Google Play平台3款健康应用(Garmin Connect、Huawei Health、Samsung...
-
ACL_cite_Based_学术句子引用价值预测标注数据集
2026年1月29日 30 59 58
数据集概述 本数据集为NAACL 2021论文配套的ACL-cite数据集,包含从ACL Anthology学术文献中提取的270余万句学术文本,及对应句子是否需要引用的标注标签,用于研究上下文对句子引用价值预测的作用。数据集含三个CSV文件,按文档ID划分训练、验证和测试集。 文件详解 压缩包文件 文件名称:ACL-cite.zip 文件格式:ZIP...
-
孟加拉语语音识别测试集_重新审视Anwesha扩展金标准数据集
2026年1月28日 30 63 57
数据集概述 本数据集为孟加拉语信息检索(IR)测试集,扩展了现有黄金标准数据集,包含100个查询-文档相关性对及1000篇文档的新测试集。文档来源于Ebela、Zee News等新闻平台及旅游博客,支持不同复杂度查询的检索性能评估,是孟加拉语IR研究的基础资源。 文件详解 BSE_qrels.json 文件格式:JSON...
-
Aisel_palletdegr_Based图像调色板检测数据集
2026年1月28日 30 117 79
数据集概述 本数据集用于图像中的调色板检测,包含匹配的.xml标注文件和.jpg图像文件,标注信息含边界框。调色板通过Unity模拟生成,具有多种退化程度。数据集以压缩包形式提供,共包含一个文件。 文件详解 文件名称:palette.zip 文件格式:ZIP...
-
ChatGPT_Based_自然语言需求不一致性检测评估补充数据
2026年1月28日 30 166 129
数据集概述 本数据集为论文《Inconsistencies Detection in Natural Language Requirements using ChatGPT: a Preliminary...
-
DOSS_IITIS_物联网网关UDP_Flood攻击合成数据集
2026年1月28日 30 164 9
数据集概述 本数据集是IITIS在DOSS项目中创建的UDP Flood网络攻击合成数据,包含针对物联网网关的攻击数据包和正常数据包,覆盖两台设备(一台被攻陷、一台发送正常流量)的流量数据,标注有真实标签,可用于测试和优化攻击检测与缓解算法。 文件详解 文件名称:UDP_Flood_dataset.xlsx 文件格式:XLSX...
-
BioEsCorpus_西班牙语临床报告生物医学实体关系注释语料库
2026年1月27日 30 207 17
数据集概述 本数据集包含对西班牙临床案例语料库(SPACCC)中18份西班牙语临床报告进行生物医学实体与语义关系标注的文件及资源。标注涵盖11类实体和8类语义关系,最终识别出324个实体(涉及10类实体)和170条关系(涉及5类关系),为生物医学文本处理研究提供结构化标注资源。 文件详解 brat_annotations目录...
-
SUN_Spot_Based_RGB_D图像空间指代表达式标注数据集
2026年1月27日 30 25 12
数据集概述 本数据集是基于SUNRGBD图像数据集的空间指代表达式(REs)标注数据,用于定位图像中的目标对象。它是唯一使用RGB-D图像的RE数据集,平均空间介词数量更多,场景更杂乱。包含3个文件,无目录结构和数据拆分。 文件详解 instances.json 文件格式:JSON...
-
ARTA_Based_软件需求气味与可测试性分析数据集_v1_0_0
2026年1月27日 30 105 94
数据集概述 本数据集是论文“Requirement testability measurement based on requirement...
-
FoldIt_Public_Dataset_结肠褶皱检测分割训练数据
2026年1月26日 30 168 13
数据集概述 本数据集是用于训练FoldIt深度学习模型的公开数据,该模型用于结肠褶皱的检测与分割。数据集包含三个训练子集:TrainA为光学结肠镜图像(OC),TrainB为叠加了结肠褶皱标注的虚拟结肠镜(VC)图像,TrainC为虚拟结肠镜图像。同时包含基于该数据集训练的FoldIt模型。 文件详解...
-
Biblical_Quotations_GT_圣经引文标注研究数据集
2026年1月25日 30 166 119
数据集概述 本数据集为“Aggadic文献中复杂引文模式自动检测”项目的研究数据,包含标注的圣经引文及相关模式数据,由海法大学团队构建。总计56个文件,含TSV格式的标注数据、JSON格式的关系层与标签集定义文件,用于支持宗教文本中圣经引文的自动识别与分析研究。 文件详解 TSV数据文件(50个)...
-
LRO_Camera_Based_月球图像COCO格式目标检测数据集
2026年1月23日 30 67 12
数据集概述 本数据集为月球勘测轨道飞行器(LRO)相机拍摄的月球图像,采用COCO格式进行标准化标注,包含陨石坑、山脉等多种月球地质特征。标注涵盖目标位置与类别信息,支持计算机视觉领域的目标检测任务,为行星科学研究提供精确的机器学习训练数据。 文件详解 文件名称:LRO_Craters_v4.zip 文件格式:ZIP(压缩包)...



