找到29个数据集

标签: 数据工程

过滤结果
  • 数据工程中数据生命周期末端作为一等公民的补充数据集

    2025年12月23日 30 162 53

    数据集概述 本数据集是论文《Treating the End of the Data Life Cycle as a First-Class Citizen in Data Engineering》的补充数据,包含演示文档、访谈编码文档及调查结果数据,为研究数据生命周期末端的工程实践提供支持。 文件详解 文件名称:...
    packageimg
  • 糖尿病数据工程操作教程

    2025年12月22日 30 198 115

    数据集概述 本数据集为一份HTML格式的教程文档,核心内容是指导如何使用pandas工具读取、结构化处理及操作糖尿病相关数据集,帮助使用者掌握数据工程基础操作方法。 文件详解 文件名称: Diabetes_Data_Engineering(Manipulation).html 文件格式: HTML (.html) 内容说明:...
    packageimg
  • 糖尿病数据集处理工程项目

    2025年12月20日 30 22 10

    数据集概述 该数据集是一个数据工程项目的成果,旨在对糖尿病数据集进行处理。数据集仅包含一个HTML格式的文件,无目录结构、训练测试集划分、数据标签分离或原始/处理数据分离,文件类型单一。 文件详解 文件名称: Diabetes_Data_Engineering.html 文件格式: HTML (.html) 文件内容:...
    packageimg
  • 数据操作数据集

    2025年12月19日 30 177 59

    数据集概述 本数据集来自Kaggle,是数据工程课程的一部分。包含一个HTML格式文件,未进行训练/测试、数据/标签或原始/处理数据的拆分,无自述文件或内容预览,文件类型单一。 文件详解 文件名称: Untitled29.html 文件格式: HTML (.html) 内容说明: 数据集唯一文件,具体字段及内容因无预览信息无法提供详细映射。 数据来源...
    packageimg
  • 糖尿病数据集分析

    2025年12月10日 30 90 82

    数据集概述 该数据集包含对糖尿病数据集的分析内容,通过清晰步骤展开,并应用了回归模型。数据以单一HTML文件形式呈现,为糖尿病相关数据分析与建模研究提供参考资料。 文件详解 文件名称:Diabetes_Data_Engineering.html 文件格式:HTML(.html)...
    packageimg
  • 非结构化数据向关系型数据库迁移的大语言模型方法数据集

    2025年12月4日 30 208 90

    数据集概述 本数据集为研究使用预训练大语言模型实现非结构化数据向关系型数据库迁移的方法提供支持,包含相关实验或案例数据的压缩文件。 文件详解 文件名称: tcc_leon_martins_datasets.zip 文件格式: ZIP压缩包 内容说明: 包含研究非结构化数据向关系型数据库迁移方法的数据集文件,具体内容需解压后查看。 适用场景...
    packageimg
  • Reddit数据科学社区帖子数据集-2000-年-maksymshkliarevskyi

    2025年6月1日 30 78 11

    Reddit数据科学社区帖子数据集-2000-年-maksymshkliarevskyi 数据来源:互联网公开数据 标签:Reddit,数据科学,社区分析,帖子数据,机器学习,深度学习,数据分析,数据工程,教育,趋势预测 数据概述: 本数据集包含来自19个Reddit数据科学相关子版块(如r/analytics, r/deeplearning,...
    packageimg
  • 以色列数据科学与工程领域职位招聘数据集-2024年双周更新

    2025年5月31日 30 34 11

    以色列数据科学与工程领域职位招聘数据集-2024年双周更新 数据来源:互联网公开数据 标签:招聘,职位,数据科学,数据分析,数据工程,机器学习,以色列,Indeed,Web抓取,时间序列 数据概述:...
    packageimg
  • 数据集创建与处理数据集CreatingDatasetforDataProcessingandCreation-sakiburrahman2000

    2025年5月28日 30 78 67

    数据集创建与处理数据集CreatingDatasetforDataProcessingandCreation-sakiburrahman2000 数据来源:互联网公开数据 标签:数据集,数据处理,机器学习,数据分析,数据科学,数据工程,数据清洗,数据构建 数据概述:...
    packageimg
  • 欧洲在线船艇交易平台船艇列表数据集-2021年

    2025年5月10日 30 25 20

    欧洲在线船艇交易平台船艇列表数据集-2021年 数据来源:互联网公开数据 标签:在线市场,船艇,欧洲,数据工程,预测分析,图片数据,元数据,文本数据,市场价格 数据概述:...
    packageimg
  • 机器学习生命周期第一阶段数据集MLOpsPhase1Dataset-hinetabi

    2025年4月25日 30 150 87

    机器学习生命周期第一阶段数据集MLOpsPhase1Dataset-hinetabi 数据来源:互联网公开数据 标签:机器学习,数据集,MLOps,开发流程,数据工程,数据清洗,模型构建,人工智能 数据概述:该数据集包含来自互联网公开资源的数据,记录了机器学习生命周期第一阶段的关键步骤,主要包括数据收集,数据清洗和数据标注。主要特征如下:...
    packageimg
  • 津迪数据工程挑战赛数据集ZindiDataEngineeringChallengeDataset-sammngoma

    2025年4月25日 30 160 116

    津迪数据工程挑战赛数据集ZindiDataEngineeringChallengeDataset-sammngoma 数据来源:互联网公开数据 标签:数据工程,挑战赛,数据清洗,数据处理,机器学习,数据科学,技术应用,数据管理 数据概述:...
    packageimg
  • 数据预处理示例数据集DataPreparationExampleDataset-omidsakaki1370

    2025年4月25日 30 61 43

    数据预处理示例数据集DataPreparationExampleDataset-omidsakaki1370 数据来源:互联网公开数据 标签:数据预处理,数据集,数据清洗,机器学习,数据分析,数据工程,数据科学,算法开发 数据概述:该数据集包含用于数据预处理和清洗的示例数据,记录了原始数据的常见问题和处理方法。主要特征如下:...
    packageimg
  • 数据清洗后通用数据集DataAfterSomeCleaningDataset-mshaheernadeem

    2025年4月25日 30 13 9

    数据清洗后通用数据集DataAfterSomeCleaningDataset-mshaheernadeem 数据来源:互联网公开数据 标签:数据清洗,数据集,数据处理,机器学习,数据分析,数据质量,数据科学,数据工程 数据概述:...
    packageimg
  • 清洗与划分数据集AllCleanedandPartitionedDatasets-migdev

    2025年4月25日 30 115 58

    清洗与划分数据集AllCleanedandPartitionedDatasets-migdev 数据来源:互联网公开数据 标签:数据清洗,数据划分,数据集,数据预处理,机器学习,数据分析,数据整理,数据工程 数据概述: 该数据集包含经过清洗和划分处理的多种数据集,旨在为数据分析和机器学习项目提供预处理后的数据。主要特征如下: 时间跨度:...
    packageimg
  • 批处理输出转换数据集BatchOutputConvertingDataset-lordix

    2025年4月25日 30 28 20

    批处理输出转换数据集BatchOutputConvertingDataset-lordix 数据来源:互联网公开数据 标签:批处理,数据转换,文件格式,数据处理,机器学习,数据工程,自动化,Python 数据概述: 该数据集包含用于批处理输出转换任务的数据,记录了不同文件格式的转换过程和结果。主要特征如下:...
    packageimg
  • 领英LinkedIn数据工程师入门级职位数据集-imranian

    2025年4月24日 30 82 26

    领英LinkedIn数据工程师入门级职位数据集-imranian 数据来源:互联网公开数据 标签:数据工程,职位,领英,招聘,入门级,职业发展,数据分析,人才市场 数据概述: 该数据集包含了从领英(LinkedIn)上抓取的数据工程师入门级职位信息,旨在为数据工程领域的求职者和行业分析提供参考。主要特征如下:...
    packageimg
  • F1赛车图像数据集用于视觉语义嵌入模型训练2023-charmainemicallef

    2025年4月24日 30 86 5

    F1赛车图像数据集用于视觉语义嵌入模型训练2023-charmainemicallef 数据来源:互联网公开数据 标签:F1,赛车,图像数据,深度学习,数据工程,视觉语义嵌入,VSE 数据概述:...
    packageimg
  • 零售数据管道构建数据集BuildingaRetailDataPipelineDataset-abdelazizsami

    2025年4月22日 30 125 115

    零售数据管道构建数据集BuildingaRetailDataPipelineDataset-abdelazizsami 数据来源:互联网公开数据 标签:零售业,数据管道,数据集,数据工程,销售分析,机器学习,ETL,BI 数据概述: 该数据集提供了构建零售数据管道所需的数据,模拟了零售业务中的各种数据来源和场景。主要特征如下:...
    packageimg
  • 数据整理与清洗项目数据集DataWranglingProjectDataset-anuragjain3

    2025年4月22日 30 90 64

    数据整理与清洗项目数据集DataWranglingProjectDataset-anuragjain3 数据来源:互联网公开数据 标签:数据整理,数据清洗,数据集,数据处理,数据分析,数据科学,机器学习,数据工程 数据概述: 该数据集来自一个数据整理与清洗项目,主要记录了原始数据的整理,清洗和处理过程。主要特征如下:...
    packageimg