找到9个数据集

标签: 数据去重

过滤结果
  • ΔvapHm_RDKit_标准蒸发焓预测数据库

    2026年2月1日 30 6 4

    数据集概述 本数据集为标准汽化焓预测数据库,包含1781种不同化学家族分子的实验标准汽化焓(ΔvapHm°)值,数据从NIST WebBook...
    packageimg
  • possible_duplicates_Working_数据去重工作数据_20241121

    2026年1月13日 30 201 191

    数据集概述 本数据集包含一份名为possible_duplicates_working_20241121.xlsx的Excel文件,无额外描述信息,推测与数据去重处理相关,用于记录或分析可能的重复数据情况。 文件详解 文件名称:possible_duplicates_working_20241121.xlsx 文件格式:XLSX...
    packageimg
  • possible_duplicates_working_20241121_数据去重工作_可能重复数据列表

    2025年12月31日 30 61 30

    数据集概述 本数据集包含一份标记为可能重复的数据列表文件,用于数据去重工作场景。文件创建于2024年11月21日,无额外描述信息,仅包含一个Excel格式文件,未划分训练/测试集、数据/标签集或原始/处理数据集。 文件详解 文件名称:possible_duplicates_working_20241121.xlsx 文件格式:XLSX...
    packageimg
  • PTX_498气胸分割胸部X光图像数据集

    2025年12月15日 30 146 126

    数据集概述 该数据集包含498张来自三家医院的气胸患者胸部X光图像,每张图像均带有像素级标注。图像统一调整为1024×1024尺寸,经Dicom标签窗宽窗位裁剪并归一化至0-255,气胸区域由两名资深放射科医生用ITK-SNAP标注,已匿名化处理。 文件详解...
    packageimg
  • 数据集重复项识别训练数据集DatasetDuplicateIdentificationTrainingDataset-saiyansong

    2025年5月28日 30 206 22

    数据集重复项识别训练数据集DatasetDuplicateIdentificationTrainingDataset-saiyansong 数据来源:互联网公开数据 标签:数据集,重复项识别,机器学习,数据清洗,数据质量,模式识别,数据科学,数据管理 数据概述: 该数据集包含来自多个来源的数据记录,专注于识别和标记数据集中的重复项。主要特征如下:...
    packageimg
  • 数据整合去重关联数据集DataIntegrationDeduplicationCorrelationDataset-girgismicheal

    2025年5月1日 30 139 117

    数据整合去重关联数据集DataIntegrationDeduplicationCorrelationDataset-girgismicheal 数据来源:互联网公开数据 标签:数据整合, 数据去重, 实体匹配, 数据清洗, 论文引用, 学术研究, 关系建模, 关联分析 数据概述:...
    packageimg
  • 数据去重与清洗数据集DD-CleanDataset-va6573

    2025年4月24日 30 185 56

    数据去重与清洗数据集DD-CleanDataset-va6573 数据来源:互联网公开数据 标签:数据去重,数据清洗,数据集,数据预处理,机器学习,数据质量,数据管理,数据处理 数据概述: 该数据集专注于数据去重与清洗任务,记录了经过预处理的数据样本。主要特征如下: 时间跨度:数据记录的时间范围未明确指定。...
    packageimg
  • 合成表格数据去重练习数据集-spac84

    2025年4月22日 30 129 48

    合成表格数据去重练习数据集-spac84 数据来源:互联网公开数据 标签:数据去重,合成数据,数据清洗,Faker,UUID,Python,数据质量,表格数据 数据概述:...
    packageimg
  • 互联网公开数据集文件与样式分析

    2025年4月8日 31 54 14

    标题:互联网公开数据集文件与样式分析 数据内容:该数据集包含了文件名和样式的详细信息,其中文件名字段有3729种不同的值,样式字段有19种不同的值。这些数据可以帮助分析文件名和样式之间的关系,以及不同样式在文件中的分布情况。 数据来源:互联网公开数据 数据用途:该数据集可以用于多个行业的数据分析,如互联网、电子商务、市场营销等。具体用途包括: -...
    packageimg