找到817个数据集

标签: 数据预处理

过滤结果
  • AI文本检测数据预处理数据集

    2025年4月17日   

    AI文本检测数据预处理数据集 数据来源:互联网公开数据 标签:AI文本检测,自然语言处理,文本分类,数据预处理,机器学习,特征工程,文本清洗 数据概述: 本数据集是原始AI文本检测数据集的预处理版本,原始数据来源于Kaggle平台(https://www.kaggle.com/datasets/thedrcat/daigt-v2-train-...
    packageimg
  • CICIDS2017网络安全入侵检测数据集2017

    2025年4月16日   

    CICIDS2017网络安全入侵检测数据集2017 数据来源:互联网公开数据 标签:网络安全,入侵检测,分类,机器学习,数据预处理 数据概述: 本数据集是CICIDS2017数据集的预处理版本,适用于二分类和多分类任务。数据集包含多种网络攻击类型的网络流量记录,经过预处理后,这些记录可用于构建和评估入侵检测模型。 数据用途概述:...
    packageimg
  • 物联网网络入侵检测数据集

    2025年4月16日   

    物联网网络入侵检测数据集 数据来源:互联网公开数据 标签:物联网,网络安全,入侵检测,网络攻击,数据预处理,不平衡数据,SMOTE技术 数据概述...
    packageimg
  • 优步2014-2015年数据分析数据集

    2025年4月16日   

    优步2014-2015年数据分析数据集 数据来源:互联网公开数据 标签:优步,出行数据,时间序列,地理分布,数据分析,数据清洗,预测建模,数据预处理 数据概述:...
    packageimg
  • Shopee预处理数据集

    2025年4月15日   

    Shopee预处理数据集 数据来源:互联网公开数据 标签:Shopee,电商,图像识别,数据预处理,商品分类,2021 Kaggle竞赛 数据概述:...
    packageimg
  • 数据30天机器学习数据集

    2025年4月15日   

    数据30天机器学习数据集 数据来源:互联网公开数据 标签:机器学习,特征编码,回归方法,数据预处理,数据融合,模型优化,数据科学 数据概述:...
    packageimg
  • 缺失值处理数据集

    2025年4月15日   

    缺失值处理数据集 数据来源:互联网公开数据 标签:缺失值,数据清洗,机器学习,数据预处理,数据分析,数据质量 数据概述: 本数据集旨在展示和处理现实世界数据集中常见的缺失值问题。缺失值通常被标识为NULL或NaN值。数据集中包含不同类型的数据特征,并故意引入了不同比例和模式的缺失值,以便用户学习和实践缺失值处理技巧。 数据用途概述:...
    packageimg
  • 肥胖数据分析数据集

    2025年4月15日   

    肥胖数据分析数据集 数据来源:互联网公开数据 标签:肥胖,饮食习惯,身体状况,机器学习,特征工程,健康数据,数据预处理 数据概述: 本数据集基于UCI Estimation of Obesity Levels Based on Eating Habits and Physical Condition数据集整理而成,包含3个文件: 1....
    packageimg
  • RSNA医学图像数据预处理数据集

    2025年4月15日   

    RSNA医学图像数据预处理数据集 数据来源:互联网公开数据 标签:医学图像,RSNA,数据预处理,测试集,CSV文件,图像分割 数据概述: 本数据集是针对RSNA(北美放射学会)医学图像数据的预处理结果,包含测试图像、分割图像及CSV文件。数据集经过标准化处理,确保了格式的一致性和可用性,为后续的医学图像分析提供了可靠的基础。 数据用途概述:...
    packageimg
  • 电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限

    2025年4月15日   

    电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限 数据来源:互联网公开数据 标签:电影,TMDB,电影数据,NLP,自然语言处理,文本分析,情感分析,数据预处理,文本清洗,机器学习 数据概述: 本数据集包含了TMDB(The Movie...
    packageimg
  • 过滤后的TMDB电影数据集

    2025年4月15日   

    过滤后的TMDB电影数据集 数据来源:互联网公开数据 标签:电影,推荐系统,数据集,影评分析,演员组合,导演风格,电影概述,数据预处理 数据概述:...
    packageimg
  • NSL-KDD网络安全分类数据集

    2025年4月15日   

    NSL-KDD网络安全分类数据集 数据来源:互联网公开数据 标签:网络安全,分类模型,数据预处理,二分类,多分类 数据概述: 本数据集是NSL-KDD数据集的预处理版本,适用于二分类和多分类的网络安全研究。数据集包含了经过清洗和预处理的网络流量记录,每条记录包含多个特征,用于识别和分类不同类型的网络攻击。 数据用途概述:...
    packageimg
  • 旅行预订与原因分析数据集1963-2021

    2025年4月15日   

    旅行预订与原因分析数据集1963-2021 数据来源:互联网公开数据 标签:旅行预订,原因分析,机器学习,分类技术,特征工程,数据预处理,模型评估 数据概述:...
    packageimg
  • 房屋价格预测数据集

    2025年4月15日   

    房屋价格预测数据集 数据来源:互联网公开数据 标签:房屋价格预测,回归分析,数据预处理,哑变量编码,房地产市场,特征工程 数据概述: 本数据集是经过转换和处理的房屋价格数据,用于数据建模。它是之前版本“Transformed Housing Data”的更新版本。在本次更新中,对某些分类特征进行了哑变量编码(One-Hot...
    packageimg
  • 成人普查收入数据集

    2025年4月15日   

    成人普查收入数据集 数据来源:互联网公开数据 标签:普查数据,收入预测,人工智能,数据预处理,分类分析,社会经济研究 数据概述: 本数据集源自1994年美国人口普查局数据库,由Ronny Kohavi和Barry...
    packageimg
  • 脏财务交易数据集

    2025年4月15日   

    脏财务交易数据集 数据来源:互联网公开数据 标签:财务交易,数据清洗,数据预处理,数据质量,缺失值,无效数据,重复数据,异常值 数据概述:...
    packageimg
  • 威斯康星乳腺癌数据集过滤版

    2025年4月15日   

    威斯康星乳腺癌数据集过滤版 数据来源:互联网公开数据 标签:乳腺癌,医学数据,数据预处理,R语言,癌症研究,健康分析,数据分析 数据概述: 本数据集是根据威斯康星乳腺癌数据集(原始来源:https://www.kaggle.com/datasets/uciml/breast-cancer-wisconsin-...
    packageimg
  • StackOverflow7万求职者数据预处理数据集

    2025年4月15日   

    StackOverflow7万求职者数据预处理数据集 数据来源:互联网公开数据 标签:Stack Overflow,求职者,程序员,职业发展,数据预处理,机器学习,编码经验,薪资,计算机技能 数据概述: 本数据集是对Stack...
    packageimg
  • 神秘二分类问题数据集1937-2021

    2025年4月15日   

    神秘二分类问题数据集1937-2021 数据来源:互联网公开数据 标签:二分类,机器学习,数据预处理,特征工程,数据集分析 数据概述: 本数据集包含937条记录,每个记录拥有21个特征。该数据集是对一个已知的公开数据集进行修改后的版本,其中一些列被重复,并且应用了诸如缩放等变换操作。 数据用途概述:...
    packageimg
  • 行业数据集

    2025年4月15日   

    行业数据集 数据来源:互联网公开数据 标签:行业分析,数据预处理,探索性数据分析,随机森林回归,SVM回归,商业趋势,市场预测 数据概述:...
    packageimg