找到15个数据集

标签: 数据拆分

过滤结果
  • Dataset_CBT_DST_原始数据_数据集

    2026年2月1日 30 184 114

    数据集概述 本数据集为CBT和DST相关的原始数据,包含1个文件,未进行训练/测试、数据/标签或原始/处理数据的拆分。数据文件以.xlsx格式存储,无其他文件类型,文件名为“CBT DST dataset.xlsx”,无嵌套目录结构,无README或内容预览可用。 文件详解 文件名称:CBT DST dataset.xlsx 文件格式:XLSX...
    packageimg
  • Sybil_Based_肺癌风险预测深度学习模型验证数据

    2026年1月30日 30 46 41

    数据集概述 本数据集是论文《Sybil: A Validated Deep Learning Model to Predict Future Lung Cancer Risk From a Single Low-Dose Chest Computed...
    packageimg
  • tweets28a_Sample_tweets28a_推文样本数据

    2026年1月27日 30 42 32

    数据集概述 本数据集为tweets28a样本数据集,包含一个JSON格式文件,无目录层级划分,未检测到命名模式,不涉及训练/测试、数据/标签、原始/处理数据的拆分。数据集专注于提供tweets28a相关的推文样本数据。 文件详解 文件名称:tweets28a_sample.json 文件格式:JSON 字段映射介绍:未提供具体字段信息 适用场景...
    packageimg
  • QA_Feedback_Based_语言模型训练细粒度人类反馈奖励数据

    2026年1月22日 30 110 15

    数据集概述 本数据集为论文“Fine-Grained Human Feedback Gives Better Rewards for Language Model Training”所用的QA-...
    packageimg
  • MedPix_2_0_Based_多模态生物医学数据集_用于高级AI应用

    2026年1月21日 30 42 23

    数据集概述 本数据集为MedPix-2.0,是面向高级AI应用的多模态生物医学数据集,包含临床病例信息、医学影像及影像文本描述等多类型数据,支持医学AI模型训练与应用开发。 文件详解 核心数据文件 文件名称:Case_topic.json 文件格式:JSON...
    packageimg
  • Neuroscience_Preprints_神经科学预印本引用分析数据集

    2026年1月21日 30 91 66

    数据集概述 本数据集包含2004至2022年神经科学领域引用预印本的出版物记录及相关引用数据,源于Scopus数据库。内容涵盖含预印本引用的神经科学文献元数据、拆分后的引用条目及预印本服务器标注信息,支持预印本影响力分析。 文件详解 数据文件...
    packageimg
  • ICSE2024_Anomaly_Based_学术会议异常数据草稿_2024

    2026年1月20日 30 6 3

    数据集概述 本数据集为ICSE2024会议相关的异常数据草稿,包含一个压缩文件,未进行训练/测试、数据/标签或原始/处理等数据拆分,无可用的自述文件或内容预览,主要用于学术研究相关场景。 文件详解 文件名称:icse_data 2.zip 文件格式:ZIP...
    packageimg
  • DUDE_Competition_Based_ICDAR2023文档理解竞赛训练验证测试集真值标注数据

    2026年1月3日 30 110 8

    数据集概述 本数据集为ICDAR 2023 DUDE竞赛提供训练、验证和测试集的真值标注,包含41454条标注数据,覆盖4974份文档。数据分为训练集、验证集和测试集,测试集为盲测集(无真值答案),已去除重复数据。 文件详解 文件名称:2023-03-23_DUDE_gt_test_PUBLIC.json 文件格式:JSON 字段映射介绍:...
    packageimg
  • FRACTESUS_UC_A533B_LUS_KJc_MCT_30_01_xlsx_Fractesus项目断裂测试微型CT原始数据

    2025年12月27日 30 119 39

    数据集概述 本数据集为Fractesus项目下的断裂测试微型CT原始数据,涉及A533B LUS材料,包含一份Excel文件,未进行训练测试、数据标签或原始处理数据的拆分,可用于医学CT相关的断裂测试数据分析。 文件详解 文件名称:FRACTESUS_UC_A533B LUS_KJc_MCT_-30_01.xlsx 文件格式:xlsx...
    packageimg
  • Objaverse_dfg02_Based_图像与三维模型数据完整集合

    2025年12月22日 30 95 72

    数据集概述 该数据集包含6个文件,主要由JPEG格式的图片文件和一个GLB格式的三维模型文件组成,无目录结构,未提供训练/测试、数据/标签等拆分,无说明文档或内容预览。 文件详解 文件名称与格式分布: .jpeg格式文件(共5个):thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg、thumb4.jpeg...
    packageimg
  • Objaverse_EFII_Detail1_Based_小样本数据集多格式文件分析数据

    2025年12月13日 30 117 38

    数据集概述 该数据集包含8个文件,以.jpeg格式图片为主(7个),另有1个.glb格式文件,未进行训练/测试、数据/标签或原始/处理等数据拆分,无说明文档或内容预览。 文件详解 图片文件(.jpeg格式,共7个):...
    packageimg
  • 视觉实体隐私学习数据集

    2025年12月12日 30 195 184

    数据集概述 本数据集包含用于视觉实体隐私学习研究的精选图像隐私数据集及预计算视觉实体。涵盖PicAlert、VISPR、PrivacyAlert等原始数据集的整理版本,图像来自Flickr,标注为公开或私有二元标签,存在公开类高不平衡性,支持灵活数据拆分与模型训练。 文件详解 精选图像隐私数据集:...
    packageimg
  • Objaverse_Restos_de_Niño_Based_儿童剩余物多格式数据完整集合

    2025年12月11日 30 174 86

    数据集概述 本数据集包含6个文件,主要由JPEG格式的栅格文件和一个GLB格式的其他文件组成,未进行训练/测试、数据/标签或原始/处理等数据拆分,无自述文件或内容预览。 文件详解...
    packageimg
  • 大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202

    2025年5月28日 30 111 20

    大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,数据拆分,文本分析,人工智能,模型训练 数据概述: 该数据集为大型语言模型版本三(LLM V3)的数据集,按照数据来源进行拆分,记录了不同来源的文本数据。主要特征如下:...
    packageimg
  • 模型开发数据拆分数据集SplitDatasetforModelDevelopment-habibmrad1983

    2025年4月25日 30 127 126

    模型开发数据拆分数据集SplitDatasetforModelDevelopment-habibmrad1983 数据来源:互联网公开数据 标签:机器学习,数据集,模型开发,数据分割,数据科学,算法训练,数据分析,预测建模 数据概述: 该数据集包含用于模型开发的数据拆分方案,记录了数据集的分割方式,用于训练集,验证集和测试集的划分。主要特征如下:...
    packageimg