找到43个数据集

标签: 标注数据集

过滤结果
  • 嫦娥五号着陆相机撞击坑检测数据集

    2026年2月15日 30 206 54

    数据集概述 本数据集包含132张嫦娥五号着陆相机的人工标注图像,每张图像中可见的撞击坑均通过边界椭圆标记,平均每张图像标注约50个撞击坑。数据集分为训练集(前100张下降过程图像)和测试集(剩余313张图像中每10张标注1张),用于月球撞击坑检测研究。 文件详解 CE5-ellipse-labels 文件格式:无扩展名(joblib dump)...
    packageimg
  • Privy_Based_PII标注协议轨迹数据集

    2026年2月9日 30 192 93

    数据集概述 本数据集是包含标注的PII数据集,内容为基于OpenAPI规范生成的协议轨迹,涵盖JSON、SQL(PostgreSQL、MySQL)、HTML和XML格式,包含六十多种PII类型。数据集以压缩包形式提供,无目录层级和文件分割。 文件详解 文件名称:privy-dataset.zip 文件格式:ZIP...
    packageimg
  • VINEPICs_Based葡萄藤RGB图像标注数据集

    2026年1月30日 30 81 10

    数据集概述 本数据集为VINEPICs葡萄藤图像集合,包含意大利皮亚琴察天主教大学葡萄园设施采集的三种葡萄品种(Red Globe、Cabernet Sauvignon、Ortrugo)的RGB图像,覆盖不同光照、相机角度、叶片密度、品种及栽培方式,用于葡萄串检测及植物表型分析任务。 文件详解 文件名称:VINEPICs.zip 文件格式:ZIP...
    packageimg
  • INCITE_Based煽动性言论标注研究数据集

    2026年2月1日 30 175 165

    数据集概述 本数据集为标注的煽动性言论数据集,与论文“Understanding Inciting Speech As New Malice”相关,该论文已被IEEE Transactions on Computational Social Systems接收。数据集用于支持煽动性言论的研究与分析,包含一份文件。 文件详解 文件名称:INCITE-...
    packageimg
  • Project_KB_Based_漏洞方法标注数据集

    2026年1月31日 30 9 4

    数据集概述 本数据集由Project-KB生成,是一个针对漏洞方法的标注数据集。每个条目对应一个方法,包含方法的元数据以及“已修复”或“存在漏洞”的标签信息。数据集以压缩包形式提供,具体细节可参考随附说明文件。 文件详解 文件名称:vuln_methods_db.zip 文件格式:ZIP...
    packageimg
  • 标注数据集_1986年切尔诺贝利核灾难_荷兰电视新闻

    2026年1月31日 30 129 71

    数据集概述 本数据集是论文“Speech-to-Local Data: Exploring ASR Files of Archived Television News (2004-2028) on the 1986 Chernobyl Nuclear...
    packageimg
  • GPT_4_Based_智能合约上下文驱动协同审计实验数据

    2026年1月30日 30 45 13

    数据集概述 本数据集为论文“A Context-Driven Approach for Co-Auditing Smart Contracts with The Support of...
    packageimg
  • UISGD_Based_UI语义组检测标注数据集_部分发布版

    2026年1月29日 30 24 1

    数据集概述 本数据集是用于UI语义组检测的标注数据集,根据公司协议仅发布部分随机抽取的数据,包含100个样本和1个COCO格式的标注JSON文件,共2个文件,无训练/测试、数据/标签等拆分,可支持UI语义组检测相关研究与模型训练。 文件详解 UISGD.zip 文件格式:ZIP 内容说明:包含100个UI语义组检测的样本数据...
    packageimg
  • Strawberry_Source_草莓图像语义分割标注数据集

    2026年1月28日 30 74 39

    数据集概述 本数据集为用于语义分割任务的草莓图像数据集,通过labelme工具完成标注,可用于pixellib训练框架。数据集以压缩包形式提供,包含原始数据,未划分训练/测试集、数据/标签集或原始/处理集,文件结构简单,便于直接使用。 文件详解 文件名称:strawberry.zip 文件格式:ZIP...
    packageimg
  • Chattack_Based_欺骗性与辱骂性在线对话标注数据集

    2026年1月28日 30 181 172

    数据集概述 本数据集为Chattack系统生成的标注数据集,包含经标注的欺骗性与辱骂性在线对话内容。Chattack系统是用于标记欺骗性和辱骂性在线行为的游戏化众包平台,数据集仅含一个文件。 文件详解 文件名称:chattackdatasetv1.json 文件格式:JSON...
    packageimg
  • YouTube_API_Based_马拉地语食谱频道评论标注数据集

    2026年1月27日 30 61 38

    数据集概述 本数据集通过YouTube API采集马拉地语食谱频道评论,覆盖Anjali Recipe Marathi等12个热门频道。评论经人工标注为感谢、食谱相关、视频相关、赞扬、混合、未定义、建议与查询7类,包含标注类别及对应样本量,为分析马拉地语食谱频道用户互动提供结构化数据。 文件详解 数据文件 文件名称:devnagiri.csv...
    packageimg
  • Gado2_Based_荷属东印度群岛多语言报纸手写文本识别标注数据集

    2026年1月26日 30 181 119

    数据集概述 本数据集包含Gado2命名实体处理应用的手写文本识别(HTR)标注数据,覆盖荷属东印度群岛及印度尼西亚的多语言报纸。因扫描质量问题,光学字符识别(OCR)错误率较高,而HTR将字符错误率(CER)降至0.5%以下,提升了命名实体识别(NER)效率。数据集含41个文件,包括无错误的全标注文件及印尼实体知识库。 文件详解...
    packageimg
  • Sentinel2_SDGSAT_Based_船舶检测遥感影像标注数据集

    2026年1月21日 30 156 106

    数据集概述 本数据集包含Sentinel2-Ship和SDGSAT-Ship两个船舶检测子数据集,提供训练、验证、测试相关数据。标注采用长边定义的旋转框格式,所有数据封装为单个压缩文件,无分层目录结构,可用于遥感影像船舶目标检测任务的模型训练与评估。 文件详解 文件名称:data.zip 文件格式:ZIP...
    packageimg
  • Softcite_Based_科学文献软件提及标注数据集_Version2

    2026年1月21日 30 171 100

    数据集概述 本数据集为Softcite Dataset Version 2,包含4971篇英文开放获取科学文献的软件提及标注,涵盖生命科学与经济学领域,共约4600万词。标注经多阶段人工标注与冲突协调,新增软件类型细分(环境、组件、隐式)及编程语言标注,是科学文献软件提及分析的金标准语料库。 文件详解 压缩包文件...
    packageimg
  • DWUG_DE_Sense_Based_德语历史词义标注数据集_v1_0_1

    2026年1月20日 30 23 17

    数据集概述 本数据集为DWUG DE词汇使用数据的子集,包含德语词汇的历史词义标注,涵盖经聚合清洗的词义标签、词汇使用对的二元语义接近度标签及词义变化标签,可用于词汇语义归纳与语义变化检测研究,版本为1.0.1。 文件详解 文件名称:dwug_de_sense.zip 文件格式:ZIP 字段映射介绍:压缩包内包含三类核心文件:...
    packageimg
  • Annotated_Dataset_带牙颌面标记的真实与AI生成人脸标注数据集

    2026年1月19日 30 69 20

    数据集概述 本数据集包含带标准化牙颌面标记的真实人类肖像与AI生成人脸标注图像,旨在支持扩散型文本转图像模型生成的合成人脸检测。数据由训练专家手动标注,涵盖牙齿形状、牙龈解剖结构、瞳孔对称性等关键牙颌面属性,为合成媒体检测、面部取证及AI问责研究提供实证基础。 文件详解 metadata.json 文件格式:JSON...
    packageimg
  • Portuguese_Comparative_Sentences_标注数据集_社交媒体与电商评论

    2026年1月9日 30 184 56

    数据集概述 本数据集为葡萄牙语比较句标注数据,包含葡萄牙语比较词词典、Twitter社交媒体标注句及Buscapé电商平台标注句三部分。数据由人工标注,涵盖比较句类型、比较实体、关键词等信息,是葡萄牙语比较意见分析的基础资源。 文件详解 葡萄牙语比较词词典文件 文件名称:portuguese_lexicon.csv 文件格式:CSV...
    packageimg
  • SAM_Sentiment_Analysis_印尼语情感词与文本细粒度标注数据集

    2026年1月15日 30 55 15

    数据集概述 本数据集为基于Self-Assessment Manikin(SAM)效价量表的印尼语细粒度情感分析数据集,包含两类核心内容:经至少45人标注并取平均的印尼语情感词SAM效价得分(1-9分),以及含情感词的印尼语推文文本(至少3名语言专家标注并取平均的1-9分情感强度),用于支持细粒度情感分析模型开发。 文件详解 文件名称:labeled...
    packageimg
  • LLM_SC_audits_GPT_4_Support_智能合约协同审计方法研究数据

    2026年1月14日 30 104 73

    数据集概述 本数据集围绕“基于上下文驱动、GPT-4支持的智能合约协同审计方法”展开,包含研究相关的文档、标注数据、代码脚本及执行脚本四类文件,可用于智能合约审计方法的研究与实践验证,总计4个文件。 文件详解 README.md(文档文件) 文件格式:MD...
    packageimg
  • 策划数据集_结核病_糖尿病_艾滋病的共病情况_已准备好用于机器学习和探索性数据分析_EDA

    2026年1月12日 30 34 7

    数据集概述 本数据集为整理后的结核病(TB)及其合并糖尿病、HIV共病的基因表达数据集,包含GSE114192、GSE193978等五个GEO数据集,已处理完毕,可直接用于机器学习算法和探索性数据分析,以根据基因表达特征分类疾病表型。数据集含27个文件,覆盖基因表达数据、元数据及数据准备脚本。 文件详解 基因表达数据文件...
    packageimg