数据集 - 海数据

Ethereum_Smart_Contract_Vulnerability_Labeled_Dataset

2025年12月30日 30 76 45

数据集概述本数据集包含以太坊智能合约代码弱点与漏洞特征的标注数据，覆盖CVE、SWC、Stack Overflow和GitHub四个数据源。通过专家标注明确漏洞类别，支持智能合约安全研究与分析，总计包含五个文件。文件详解标注数据文件（XML格式）...

ZIP

媒体偏见标注专家数据集

2025年12月22日 30 117 111

数据集概述本数据集聚焦媒体偏见检测，通过对比众包标注与专家标注的差异，验证专家标注对提升数据质量的作用。数据包含专家标注结果、众包原始数据及标注指南，旨在为偏见检测模型提供更可靠的基准数据，解决现有偏见语料库标注一致性低的问题。文件详解专家标注文件: annotations_expert1.xlsx:...

ZIP

前列腺MRI与超声配准挑战赛数据集

2025年12月21日 30 102 88

数据集概述本数据集为前列腺MRI与超声配准挑战赛（mu-Reg challenge）专用数据，包含超百对配对的MR与TRUS图像，由具备15年以上相关经验的研究人员和临床医生精心标注，旨在解决临床实践中公开高质量配对数据稀缺、标注依赖多学科专家知识的问题，为配准算法基准测试提供支持。文件详解...

ZIP

SecReq安全需求启发式分类数据集

2025年12月16日 30 91 32

数据集概述本数据集支持安全需求启发式分类模型的训练与评估，包含专家标注的安全相关需求数据、训练测试集文件及配套评估工具，可复现安全需求识别研究结果，助力开发者弥合安全实践与开发经验的差距。文件详解该数据集包含以下文件： - 专家分类数据文件: - ePurse-combined-anon.xls:...

ZIP

MIDOG2025非典型与正常有丝分裂分类训练数据集

2025年12月15日 30 95 30

数据集概述该数据集是MIDOG 2025非典型训练集，包含MIDOG++全数据集的非典型与正常有丝分裂图像分类数据，涵盖来自7个领域的11939个有丝分裂图像，提供三位专家盲法多数投票结果，修正了CSV文件的重复和缺失条目问题。文件详解文件名称：MIDOG25_Atypical_Classification_Train_Set.csv...

ZIP

二氧化碳排放标注的黄金标准与标注数据集

2025年12月15日 30 91 28

数据集概述本数据集是用于从企业年度及可持续发展报告中提取温室气体排放数据的基准数据集，包含黄金标准数据集与标注数据集，涵盖三个阶段的标注结果，为相关研究提供标准化数据支持。文件详解数据文件：...

ZIP

基于大语言模型的非功能需求自动化优先级排序数据集

2025年12月15日 30 113 5

数据集概述本数据集围绕基于大语言模型（LLM）的非功能需求（NFRs）自动化识别与优先级排序展开，包含从开源项目源代码中提取的自动识别NFRs数据、专家手动标注数据及相关分析代码与文档，为研究软件需求工程中的NFRs反向获取方法提供支持。文件详解分析与代码文件： nfr_analysis_pipeline.ipynb：Jupyter...

ZIP

波士顿新生儿缺氧缺血性脑病脑损伤数据集第一部分_2023

2025年12月14日 30 59 22

数据集概述本数据集是首个公开的新生儿缺氧缺血性脑病（HIE）脑损伤数据集，包含一百三十三名HIE患儿的弥散MRI影像及专家标注的病灶数据。HIE病灶多为弥漫性小病灶（超半数患者病灶占脑体积不足百分之一），其分割任务比脑肿瘤等局灶性大病灶更具挑战性，旨在推动HIE及小弥散病灶MRI分割方法的发展。文件详解文件名称：Readme 文件格式：无扩展名...

ZIP

古希腊与拉丁语翻译对齐标注指南及黄金标准数据集

2025年12月14日 30 56 14

数据集概述本数据集包含古希腊文本与拉丁语学术翻译对齐的标注指南及黄金标准，涵盖100条随机选自Digital Fragmenta Historicorum Graecorum的片段，由专家手动对齐，标注者间一致性达90.5%，可用于翻译对齐任务的执行、评估及模型训练。文件详解核心文件：...

ZIP

ArtInsight画作劣化检测精确标注数据集

2025年12月13日 30 119 72

数据集概述该数据集是针对架上画作劣化检测的精确标注数据集，包含高分辨率画作图像及专家修复师标注的劣化区域，支持人工智能技术在艺术修复领域的应用，已通过Mask-RCNN等模型验证其鲁棒性。文件详解文件名称: Dataset.zip 文件格式: ZIP压缩包内部文件内容: LPL（绘画层缺失空洞）数据：...

ZIP

生态数据挖掘大语言模型评估与基准测试数据集

2025年12月12日 30 151 131

数据集概述本数据集包含生态数据挖掘场景下大语言模型（LLM）评估的完整资源，涵盖500篇摘要数据、专家验证的标注及模型输出，辅以可复现评估流程的脚本，支持LLM性能验证、模型探索及跨领域适配。文件详解文件名称: CodesAndDatasets.zip 文件格式: ZIP压缩包包含内容:...

ZIP

电气和电子元件数据集

2025年12月11日 30 118 19

数据集概述该数据集是电气和电子元件的3D网格模型集合，包含三位专家标注的语义分割标签，支持机器学习、计算机视觉及计算几何研究，可用于算法训练与评估。文件详解文件名称: Electrical and Electronic Components Dataset.zip 文件格式: ZIP（压缩包）内容说明:...

ZIP

Carinthia_S_Dataset_Based_半导体晶圆缺陷SEM图像分析完整数据

2025年12月11日 30 88 66

数据集概述该数据集是原始Carinthia数据集的增强版本，包含非结构化半导体晶圆单一生产层缺陷的扫描电子显微镜（SEM）图像，以及每个缺陷图像对应的专家验证二进制分割掩码。数据集共四千五百九十一组图像与掩码对，不均匀分布在六个缺陷类别中。文件详解文件名称: data.zip：压缩文件格式，包含所有SEM缺陷图像及其对应的分割掩码文件。...

ZIP

基于物联网的活动检测服务生成器原型与评估数据集

2025年12月10日 30 207 0

数据集概述该数据集是物联网活动检测服务生成器原型的配套数据，包含智能工厂与智慧医疗两个场景的服务生成及评估文件。按功能分为服务生成与应用评估子文件夹，提供生成服务的Python脚本、物联网输入数据、专家标注、评估用物联网日志、真值数据及检测结果等，支持复现论文中的服务生成与评估流程。文件详解...

ZIP

工件表面图像数据集

2025年12月7日 30 189 158

数据集概述该数据集包含通过工业内窥镜和显微镜相机采集的工件表面RGB图像，分辨率为2592×1944像素，所有图像由专家手动标注并按表面磨损程度分类。文件详解文件名称: surfaces.zip 文件格式: ZIP压缩包内容说明: 压缩包内包含工件表面图像数据，未提供具体内部文件结构及字段信息适用场景工业检测研究:...

ZIP

平菇生长与收获监测数据集2022

2025年12月7日 30 167 115

数据集概述本数据集包含两个独立子数据集，用于监测平菇生长状态及判断收获时机。数据于2022年7-8月在希腊格雷韦纳温室采集，涵盖专家标注的收获分类数据与多日生长图像数据，为平菇生长研究提供支持。文件详解文件名称: ReadMe.pdf 文件格式: PDF 内容说明: 可能包含数据集背景、采集方法、子数据集介绍及使用说明等文档信息文件名称:...

ZIP

西班牙与葡萄牙八座山地公园社交媒体数据集2015_2022

2025年12月4日 30 6 2

数据集概述本数据集包含2015至2022年间从Flickr和Twitter/X平台获取的八座西班牙与葡萄牙山地国家公园的地理标记照片及元数据，经人工智能模型和专家标注处理，为相关研究提供基础数据支持。文件详解数据库元数据文件：...

ZIP

专业咨询对话质量评估与分析数据集AnnoMI-rahulbaburaj

2025年4月22日 30 9 4

专业咨询对话质量评估与分析数据集AnnoMI-rahulbaburaj 数据来源：互联网公开数据标签：咨询对话,心理健康,语言分析,情感识别,治疗方法,自然语言处理,动机性访谈,MI,专家标注数据概述： AnnoMI数据集是首个公开、免费的专家标注咨询对话数据集，专注于动机性访谈（MI，Motivational...