找到1,589个数据集

格式: ZIP 标签: 特征工程

过滤结果
  • 亚马逊机器学习挑战赛数据集

    2025年6月4日 30 164 74

    亚马逊机器学习挑战赛数据集 数据来源:互联网公开数据 标签:机器学习,数据预处理,比赛,特征工程,分类模型,印度 数据概述:...
    packageimg
  • 维度30训练数据集

    2025年6月4日 30 183 126

    维度30训练数据集 数据来源:互联网公开数据 标签:训练数据,维度分析,分类模型,特征工程,数据清洗,机器学习,深度学习 数据概述: 本数据集包含用于训练机器学习模型的维度30数据集,涵盖了多个特征维度及其对应的分类标签。数据集经过初步清洗和预处理,确保了数据的完整性和一致性。数据集适用于分类任务、特征提取、模型优化等场景。 数据用途概述:...
    packageimg
  • 细胞多模态单细胞集成特征数据集-2022-alexandervc

    2025年6月4日 30 198 118

    细胞多模态单细胞集成特征数据集-2022-alexandervc 数据来源:互联网公开数据 标签:单细胞测序,CITE-seq,多模态分析,特征工程,机器学习,PCA,MLP,细胞生物学,生物信息学 数据概述: 本数据集包含2274个用于细胞多模态单细胞集成的特征,这些特征来自于CITE-...
    packageimg
  • 单细胞扰动机器学习补充计算数据集

    2025年6月4日 30 93 62

    单细胞扰动机器学习补充计算数据集 数据来源:互联网公开数据 标签:单细胞扰动,机器学习,特征工程,分子描述符,SMILES指纹,ChemBERTa嵌入,药物发现,生物信息学,人工智能 数据概述: 本数据集包含单细胞扰动实验相关的补充计算数据,旨在支持机器学习模型在单细胞生物数据中的应用研究。数据集包括以下主要内容: 1. 特征工程生成的特征: -...
    packageimg
  • OGBN-MAG异构学术网络数据集

    2025年6月4日 30 196 135

    OGBN-MAG异构学术网络数据集 数据来源:互联网公开数据 标签:异构网络,学术图谱,多分类,特征工程,关系建模,机器学习基准 数据概述: OGBN-MAG数据集是Open Graph Benchmark(OGB)中的一个异构学术网络数据集,基于Microsoft Academic...
    packageimg
  • Steam游戏商店数据集-数值编码版2023

    2025年6月4日 30 197 152

    Steam游戏商店数据集-数值编码版2023 数据来源:互联网公开数据 标签:Steam,游戏商店,数据集,数值编码,游戏分析,特征工程,游戏市场 数据概述:...
    packageimg
  • 堆叠模型数据集

    2025年6月1日 30 154 104

    堆叠模型数据集 数据来源:互联网公开数据 标签:堆叠模型,机器学习,特征工程,竞赛数据,Python代码,模型优化,验证准确率 数据概述: 本数据集包含当前竞赛中使用的7个堆叠模型及其相关数据文件。数据集包括以下内容: 1. 以Pickle格式存储的堆叠模型文件(7个模型)。 2. 经过特征工程处理后的train.csv和test.csv文件。 3....
    packageimg
  • IEEE论文投稿与用户身份识别模型预测数据集-kyakovlev

    2025年6月1日 30 145 48

    IEEE论文投稿与用户身份识别模型预测数据集-kyakovlev 数据来源:互联网公开数据 标签:IEEE, 论文投稿, 用户身份识别, 机器学习, 模型预测, CatBoost, LGBM, XGBoost, 神经网络, 特征工程, 模型融合 数据概述:...
    packageimg
  • 哥伦比亚COVID-19特征工程数据集

    2025年4月15日 60 80 55

    哥伦比亚COVID-19特征工程数据集 数据来源:互联网公开数据 标签:哥伦比亚,COVID-19,特征工程,数据处理,机器学习,公共卫生,疫情分析 数据概述:...
    packageimg
  • 质数特征分析数据集1至1000万-danielha20

    2025年6月1日 30 2 1

    质数特征分析数据集1至1000万-danielha20 数据来源:互联网公开数据 标签:质数,数学,数据分析,特征工程,教育,科研,数学研究,数论 数据概述: 本数据集收录了从1到1000万的数字相关信息,主要用于识别质数及其相关特征。数据集包含多个字段,旨在帮助研究者深入分析质数的特性和分布规律。 数据字段定义:...
    packageimg
  • PetFinder-my宠物照片受欢迎程度预测数据集-竞赛数据

    2025年6月1日 30 40 18

    PetFinder-my宠物照片受欢迎程度预测数据集-竞赛数据 数据来源:互联网公开数据 标签:宠物,图像识别,机器学习,受欢迎度,竞赛,PetFinder.my,特征工程,计算机视觉 数据概述:...
    packageimg
  • 航班延误预测经典回归数据集-2009-lcsldatasets

    2025年6月1日 30 36 13

    航班延误预测经典回归数据集-2009-lcsldatasets 数据来源:互联网公开数据 标签:航班延误,回归分析,航空,数据集,时间序列,特征工程,预处理 数据概述:...
    packageimg
  • 数据预处理示例数据集

    2025年6月1日 30 55 17

    数据预处理示例数据集 数据来源:互联网公开数据 标签:数据预处理,特征工程,机器学习,模型训练,数值缩放,缺失值处理,离散化 数据概述:...
    packageimg
  • 天池安全AI挑战赛第六期恶意代码检测数据集-monsterliu

    2025年6月1日 30 71 26

    天池安全AI挑战赛第六期恶意代码检测数据集-monsterliu 数据来源:互联网公开数据 标签:安全,AI,恶意代码,检测,机器学习,天池,阿里巴巴,对抗样本,特征工程,二进制文件分析 数据概述:...
    packageimg
  • 保险二分类数据集

    2025年6月1日 30 148 114

    保险二分类数据集 数据来源:互联网公开数据 标签:保险,二分类,客户画像,风险评估,业务决策,数据分析,特征工程 数据概述:...
    packageimg
  • 电商用户行为与商品信息数据集-recepbattal

    2025年6月1日 30 159 112

    电商用户行为与商品信息数据集-recepbattal 数据来源:互联网公开数据 标签:电商,用户行为,商品信息,SQL,数据清洗,特征工程,机器学习,用户画像,购物篮分析 数据概述: 本数据集包含两个主要文件夹:customer(用户)和item(商品),分别包含与用户交互和商品信息相关的数据。 Customer文件夹:...
    packageimg
  • optiver股票波动率预测训练特征数据集-2021

    2025年5月31日 30 157 41

    optiver股票波动率预测训练特征数据集-2021 数据来源:互联网公开数据 标签:optiver,股票,波动率,金融数据,机器学习,特征工程,预测分析,kaggle 数据概述: 本数据集包含Optiver Realized...
    packageimg
  • 芝加哥Cyclistic共享单车骑行数据分析数据集-2022年-datalearn

    2025年5月31日 30 195 54

    芝加哥Cyclistic共享单车骑行数据分析数据集-2022年-datalearn 数据来源:互联网公开数据 标签:共享单车,骑行数据,芝加哥,用户行为,时间序列,出行分析,数据清洗,特征工程 数据概述:...
    packageimg
  • Optiver股票交易市场数据处理与聚合数据集-预测波动率竞赛

    2025年5月31日 30 171 45

    Optiver股票交易市场数据处理与聚合数据集-预测波动率竞赛 数据来源:互联网公开数据 标签:股票交易,市场数据,波动率预测,金融,量化交易,数据聚合,特征工程,Optiver竞赛 数据概述: 本数据集是针对Optiver真实波动率预测竞赛所提供原始数据的处理版本,旨在将原始的股票买卖盘数据(book data)和交易数据(trade...
    packageimg
  • 桑坦德银行客户流失数据集

    2025年5月31日 30 58 38

    桑坦德银行客户流失数据集 数据来源:互联网公开数据 标签:银行客户,客户流失,交易预测,机器学习,特征工程,模型训练 数据概述: 本数据集整合了来自两个不同竞赛的数据,分别来自Kaggle平台的“ Santander Customer Transaction Prediction”和“ Playground Series Season 4...
    packageimg