找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 芝加哥共享单车骑行数据分析数据集-2021年7月至2022年6月

    2025年5月7日   

    芝加哥共享单车骑行数据分析数据集-2021年7月至2022年6月 数据来源:互联网公开数据 标签:共享单车,骑行数据,芝加哥,出行,交通,时间序列,用户行为,数据清洗 数据概述: 本数据集整合了2021年7月至2022年6月期间,芝加哥共享单车 (Divvy)...
    packageimg
  • 字符检测与分类数据集

    2025年6月1日   

    字符检测与分类数据集 数据来源:互联网公开数据 标签:字符识别,目标检测,分类,OCR,图像处理,机器学习,深度学习,Yolov3,数据集构建 数据概述:...
    packageimg
  • SecureCC源代码漏洞检测数据集-2021年-cerengen

    2025年6月1日   

    SecureCC源代码漏洞检测数据集-2021年-cerengen 数据来源:互联网公开数据 标签:SecureC,漏洞检测,C语言,源代码,安全,数据集,代码模板 数据概述: 本数据集是一个结合了SARD-Juliet数据集、Draper...
    packageimg
  • Tashkeela清理阿拉伯语带音符语料库

    2025年6月1日   

    Tashkeela清理阿拉伯语带音符语料库 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,文本清洗,语音标注,语言模型,机器学习,数据标注 数据概述:...
    packageimg
  • PySparkling与SparklingWater集成数据集-2023

    2025年6月1日   

    PySparkling与SparklingWater集成数据集-2023 数据来源:互联网公开数据 标签:PySparkling,Sparkling Water,H2O,Spark,大数据,机器学习,算法,集成,Python,数据处理 数据概述: 本数据集涵盖了PySparkling与Sparkling...
    packageimg
  • 优步数据库虚构案例数据集-2023年

    2025年6月1日   

    优步数据库虚构案例数据集-2023年 数据来源:互联网公开数据 标签:优步,数据库,虚构案例,数据集,大学项目,数据分析,交通数据 数据概述:...
    packageimg
  • 芝加哥Divvy共享单车骑行数据分析数据集-2021年11月至2022年10月

    2025年6月1日   

    芝加哥Divvy共享单车骑行数据分析数据集-2021年11月至2022年10月 数据来源:互联网公开数据 标签:共享单车,骑行数据,交通,芝加哥,时间序列,数据分析,Divvy,出行,用户行为 数据概述:...
    packageimg
  • Coursera暗物质粒子候选体探测实验数据集-AHC第4周-sahelibasu

    2025年6月1日   

    Coursera暗物质粒子候选体探测实验数据集-AHC第4周-sahelibasu 数据来源:互联网公开数据 标签:暗物质,粒子物理,机器学习,高能物理,数据分析,实验数据,希格斯玻色子,对撞实验,Coursera 数据概述: 本数据集是 Coursera 平台 Advanced Health Care (AHC)...
    packageimg
  • TensorFlow2-0问答数据集简化版-问答数据

    2025年6月1日   

    TensorFlow2-0问答数据集简化版-问答数据 数据来源:互联网公开数据 标签:TensorFlow,问答,自然语言处理,机器学习,数据集,文本分析,简化版 数据概述: 本数据集基于TensorFlow...
    packageimg
  • 数据预处理示例数据集

    2025年6月1日   

    数据预处理示例数据集 数据来源:互联网公开数据 标签:数据预处理,特征工程,机器学习,模型训练,数值缩放,缺失值处理,离散化 数据概述:...
    packageimg
  • 头饰图像分类数据集-帽子-头盔等20类-训练-测试与验证集-gpiosenka

    2025年6月1日   

    头饰图像分类数据集-帽子-头盔等20类-训练-测试与验证集-gpiosenka 数据来源:互联网公开数据 标签:头饰,图像分类,机器学习,深度学习,帽子,头盔,图像识别,计算机视觉 数据概述: 本数据集是一个用于头饰图像分类的图像数据集,包含20个类别的头饰图像,例如帽子、棒球帽、头盔等。 数据集分为训练集、测试集和验证集,总共包含3820张图像。...
    packageimg
  • 手写地址数据集

    2025年6月1日   

    手写地址数据集 数据来源:互联网公开数据 标签:手写识别,地址信息,图像分类,OCR,邮政编码,城市信息,自然语言处理 数据概述:...
    packageimg
  • 狗品种分类数据集

    2025年6月1日   

    狗品种分类数据集 数据来源:互联网公开数据 标签:狗品种,图像分类,深度学习,计算机视觉,数据预处理,图像识别 数据概述: 本数据集来源于Kaggle平台上举办的“狗品种识别”比赛,包含经过预处理的狗品种图像数据。原始图像经过统一调整为128x128像素,并转换为numpy数组格式且展平。数据集包含10222张图像,每张图像的形状为(128, 128,...
    packageimg
  • 电商用户行为与商品信息数据集-recepbattal

    2025年6月1日   

    电商用户行为与商品信息数据集-recepbattal 数据来源:互联网公开数据 标签:电商,用户行为,商品信息,SQL,数据清洗,特征工程,机器学习,用户画像,购物篮分析 数据概述: 本数据集包含两个主要文件夹:customer(用户)和item(商品),分别包含与用户交互和商品信息相关的数据。 Customer文件夹:...
    packageimg
  • MJAR离线模型数据集

    2025年5月31日   

    MJAR离线模型数据集 数据来源:互联网公开数据 标签:离线模型,机器学习,自动化建模,MJAR,无网络依赖,模型部署,代码示例 数据概述: 本数据集旨在提供一个离线环境下的MJAR Automl模型导入解决方案,适用于无网络连接的场景。数据集包含MJAR...
    packageimg
  • 预处理版虚假新闻识别数据集-ceasor6

    2025年5月31日   

    预处理版虚假新闻识别数据集-ceasor6 数据来源:互联网公开数据 标签:虚假新闻,文本分析,自然语言处理,机器学习,文本预处理,情感分析,数据增强 数据概述:...
    packageimg
  • 维基百科句子拆分数据集-2023-thedevastator

    2025年5月31日   

    维基百科句子拆分数据集-2023-thedevastator 数据来源:互联网公开数据 标签:维基百科,句子拆分,NLP,自然语言处理,文本分析,数据集,机器学习 数据概述:...
    packageimg
  • 网络爬取图像及描述数据集

    2025年5月31日   

    网络爬取图像及描述数据集 数据来源:互联网公开数据 标签:图像描述,网络爬取,计算机视觉,自然语言处理,多模态学习,图像理解,视觉分析,文本生成,数据清洗,数据增强 数据概述: 本数据集是一个从互联网公开数据中收集的大型图像-...
    packageimg
  • HMS有害脑部活动分类竞赛EfficientNetB0模型权重数据集-5折交叉验证-alejopaullier

    2025年5月31日   

    HMS有害脑部活动分类竞赛EfficientNetB0模型权重数据集-5折交叉验证-alejopaullier 数据来源:互联网公开数据 标签:HMS,有害脑部活动,模型权重,机器学习,深度学习,竞赛,PyTorch,5折交叉验证 数据概述: 本数据集包含用于有害脑部活动分类竞赛的EfficientNet...
    packageimg
  • 芝加哥Cyclistic共享单车骑行数据分析数据集-2022年-datalearn

    2025年5月31日   

    芝加哥Cyclistic共享单车骑行数据分析数据集-2022年-datalearn 数据来源:互联网公开数据 标签:共享单车,骑行数据,芝加哥,用户行为,时间序列,出行分析,数据清洗,特征工程 数据概述:...
    packageimg