找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 数据集处理与预测任务数据集2019年9月9日-omnamahshivai

    2025年4月22日   

    数据集处理与预测任务数据集2019年9月9日-omnamahshivai 数据来源:互联网公开数据 标签:数据处理,预测任务,数据集,机器学习,时间序列,数据分析,商业智能,算法优化 数据概述: 该数据集包含来自公开数据源的处理与预测任务相关数据,记录了数据预处理和预测模型训练所需的核心信息。主要特征如下:...
    packageimg
  • 合成客户数据清洗练习数据集-hassaneskikri

    2025年4月22日   

    合成客户数据清洗练习数据集-hassaneskikri 数据来源:互联网公开数据 标签:数据清洗,客户数据,数据集,机器学习,数据分析,Python,数据预处理,模拟数据 数据概述: 该数据集包含模拟的客户数据,旨在用于数据清洗和预处理练习。主要特征如下: 时间跨度:不适用,数据集为静态数据。 地理范围:不适用,数据集不涉及地理位置信息。...
    packageimg
  • 法律条款库合同条款分类与异常检测数据集-bahushruth

    2025年4月22日   

    法律条款库合同条款分类与异常检测数据集-bahushruth 数据来源:互联网公开数据 标签:法律条款,合同条款,分类,异常检测,机器学习,法律科技,文本分析 数据概述:...
    packageimg
  • 匿名二元分类问题数据集-joachimrives

    2025年4月22日   

    匿名二元分类问题数据集-joachimrives 数据来源:互联网公开数据 标签:二元分类,机器学习,数据集,匿名数据,分类任务,模型训练,数据隐私,算法评估 数据概述: 该数据集包含一个匿名的二元分类问题的数据,旨在用于机器学习模型的训练和评估。主要特征如下: 时间跨度:数据收集时间不明确。 地理范围:数据来源地不明确,为匿名数据。...
    packageimg
  • Goodreads图书信息数据集-2021-khanhdnguyen

    2025年4月22日   

    Goodreads图书信息数据集-2021-khanhdnguyen 数据来源:互联网公开数据 标签:Goodreads,图书,数据集,爬虫,数据清洗,可视化,分类,推荐,预测 数据概述:...
    packageimg
  • Kaggle竞赛优胜方案预处理数据集-yosefmahmoud

    2025年4月22日   

    Kaggle竞赛优胜方案预处理数据集-yosefmahmoud 数据来源:互联网公开数据 标签:机器学习,竞赛,数据预处理,特征工程,数据集,解决方案,模型构建,数据分析 数据概述:该数据集包含了Kaggle竞赛中优胜方案的数据预处理步骤和处理后的数据。主要特征如下: 时间跨度:数据来源于Kaggle竞赛,时间跨度取决于具体的竞赛时间。...
    packageimg
  • 日本二手车拍卖数据集-2021年-digillex

    2025年4月22日   

    日本二手车拍卖数据集-2021年-digillex 数据来源:互联网公开数据 标签:二手车,拍卖,日本,汽车数据,数据分析,教育,实践 数据概述:...
    packageimg
  • 纳什维尔住房销售数据清理与分析数据集-2021-swsw1717

    2025年4月22日   

    纳什维尔住房销售数据清理与分析数据集-2021-swsw1717 数据来源:互联网公开数据 标签:纳什维尔,住房销售,房产信息,业主信息,税收信息,数据清理,SQL查询,数据分析 数据概述:...
    packageimg
  • 英国航空乘客评价数据集-202X年-dharun4772

    2025年4月22日   

    英国航空乘客评价数据集-202X年-dharun4772 数据来源:互联网公开数据 标签:英国航空,乘客评价,数据清洗,数据转换,航空业,客户反馈,用户体验 数据概述: 本数据集来源于SkyTraX官方网站,包含英国航空(British...
    packageimg
  • 埃尼隆电子邮件数据集-2001至2002年-bertvankeulen

    2025年4月22日   

    埃尼隆电子邮件数据集-2001至2002年-bertvankeulen 数据来源:互联网公开数据 标签:埃尼隆,电子邮件,垃圾邮件,数据分析,spam,过滤器测试,机器学习,NB,希腊信息学与电信研究所 数据概述:...
    packageimg
  • 医疗健康模拟患者数据-数据分析与机器学习实践数据集-usmankha

    2025年4月22日   

    医疗健康模拟患者数据-数据分析与机器学习实践数据集-usmankha 数据来源:互联网公开数据 标签:医疗健康,患者数据,模拟数据,数据分析,机器学习,数据可视化,医疗,教育 数据概述: 本数据集包含51,000条模拟患者记录,由Python编程和Faker库生成。数据集旨在用于教育和研究目的,特别适用于数据分析、机器学习和数据可视化技术的实践。...
    packageimg
  • KaggleX评估数据集KaggleXAssessmentDataset-sameernavuduri

    2025年4月22日   

    KaggleX评估数据集KaggleXAssessmentDataset-sameernavuduri 数据来源:互联网公开数据 标签:数据评估,数据集,机器学习,数据科学,模型训练,统计分析,人工智能,预测分析 数据概述: 该数据集来自Kaggle X项目,主要用于数据评估和模型训练。主要特征如下:...
    packageimg
  • CSV文件上传测试数据集-lavenderbrown

    2025年4月22日   

    CSV文件上传测试数据集-lavenderbrown 数据来源:互联网公开数据 标签:数据上传,CSV文件,测试,数据分析,文件处理,机器学习,数据管理,数据验证 数据概述: 该数据集包含用于测试CSV文件上传功能的数据。主要特征如下: 时间跨度:无明确时间范围,数据为模拟生成。 地理范围:无特定地理范围,数据不涉及具体地点。...
    packageimg
  • 信用卡欺诈交易风险预测数据集-hanadinh0492

    2025年4月22日   

    信用卡欺诈交易风险预测数据集-hanadinh0492 数据来源:互联网公开数据 标签:信用卡,欺诈,交易,风险,机器学习,分类,Python,金融,风控 数据概述:...
    packageimg
  • 西班牙车辆注册信息数据库样本-全国-2024-dananos

    2025年4月22日   

    西班牙车辆注册信息数据库样本-全国-2024-dananos 数据来源:互联网公开数据 标签:车辆,西班牙,交通,注册信息,汽车,摩托车,数据样本 数据概述:...
    packageimg
  • 医疗文本PHI受保护健康信息标注数据集-vijayakashv03

    2025年4月22日   

    医疗文本PHI受保护健康信息标注数据集-vijayakashv03 数据来源:互联网公开数据 标签:PHI,医疗文本,数据标注,隐私保护,NLP,自然语言处理,文本处理,数据安全,敏感信息,信息脱敏 数据概述: 本数据集专为敏感信息脱敏设计,特别是受保护健康信息(PHI, Protected Health...
    packageimg
  • ArianaGrande官网库存数据集-2021年-madroscla

    2025年4月22日   

    ArianaGrande官网库存数据集-2021年-madroscla 数据来源:互联网公开数据 标签:Ariana Grande,官网,库存,销售预测,数据分析,数据清理,电商,产品库存,时间序列 数据概述: 本数据集包含Ariana...
    packageimg
  • Playground第四季第二集辅助数据集2024-ravi20076

    2025年4月22日   

    Playground第四季第二集辅助数据集2024-ravi20076 数据来源:互联网公开数据 标签:Playground,竞赛,辅助数据,机器学习,数据科学,Kaggle,代码论坛 数据概述:...
    packageimg
  • RuuviTag环境与传感器数据采集数据集-2024年-jukkei

    2025年4月22日   

    RuuviTag环境与传感器数据采集数据集-2024年-jukkei 数据来源:互联网公开数据 标签:RuuviTag,环境监测,传感器数据,蓝牙,温度,湿度,气压,加速度,微秒时间戳,数据分析,物联网 数据概述: 本数据集包含使用RuuviTag传感器采集的环境数据,该传感器通过蓝牙信标发送测量信息。...
    packageimg
  • 二次元图像标签数据集Danbooru标签数据集-user626google

    2025年4月22日   

    二次元图像标签数据集Danbooru标签数据集-user626google 数据来源:互联网公开数据 标签:二次元图像,数据集,图像标注,计算机视觉,机器学习,图像分类,数据清洗,标签管理 数据概述: 该数据集包含来自Danbooru网站的二次元图像标签数据,记录了大量二次元图像的标签信息。主要特征如下: 时间跨度:数据记录的时间范围从2006年到现。...
    packageimg