找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 正态分布与Z-Score异常值剔除数据集-panagiotisprassas

    2025年4月23日   

    正态分布与Z-Score异常值剔除数据集-panagiotisprassas 数据来源:互联网公开数据 标签:异常值检测,正态分布,Z-Score,数据清洗,机器学习,统计分析,数据预处理,数据科学 数据概述: 该数据集包含模拟生成的符合正态分布的数据,并结合Z-Score方法进行异常值检测与剔除。主要特征如下: 时间跨度:...
    packageimg
  • 基础数据集Back-to-BasicsDataset-hypdeb

    2025年4月23日   

    基础数据集Back-to-BasicsDataset-hypdeb 数据来源:互联网公开数据 标签:基础数据,数据集,统计分析,机器学习,教育研究,数据清洗,数据处理,数据科学 数据概述: 该数据集包含基础性的数据信息,适用于数据科学和统计分析的学习与训练。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能包含多年数据。...
    packageimg
  • SanberCode数据科学0620最终项目数据集-2020-lewihansel

    2025年4月23日   

    SanberCode数据科学0620最终项目数据集-2020-lewihansel 数据来源:互联网公开数据 标签:数据科学,机器学习,薪资预测,培训集,测试集,提交文件,数据预处理,预测建模 数据概述:...
    packageimg
  • 未来销售预测俄语转英语翻译数据集-2013至2015年-remisharoon

    2025年4月23日   

    未来销售预测俄语转英语翻译数据集-2013至2015年-remisharoon 数据来源:互联网公开数据 标签:销售预测,零售,时间序列分析,数据竞赛,Kaggle,俄语转英语,零售业 数据概述: 本数据集是Kaggle竞赛“Predict Future...
    packageimg
  • 阿尔及利亚方言医学问答数据集-2022-boulesnane

    2025年4月23日   

    阿尔及利亚方言医学问答数据集-2022-boulesnane 数据来源:互联网公开数据 标签:阿尔及利亚,阿拉伯语,医学问答,对话机器人,Seq2Seq,健康咨询,自然语言处理 数据概述:...
    packageimg
  • 更多填充标签数据集MoreImputedLabelsDataset-arghakamalsamanta

    2025年4月23日   

    更多填充标签数据集MoreImputedLabelsDataset-arghakamalsamanta 数据来源:互联网公开数据 标签:数据填充,标签预测,数据集,机器学习,数据增强,模式识别,统计分析,数据科学 数据概述: 该数据集包含经过填充的标签数据,记录了从原始数据中预测或补充的标签信息。主要特征如下:...
    packageimg
  • CSV格式示例数据集CSVExampleDataset-raztiracvyan

    2025年4月23日   

    CSV格式示例数据集CSVExampleDataset-raztiracvyan 数据来源:互联网公开数据 标签:CSV格式,数据集,数据示例,数据格式,数据分析,数据处理 数据概述: 该数据集包含CSV格式的示例数据,用于展示CSV文件的基本结构和内容。主要特征如下: 时间跨度:数据记录的时间范围无具体时间要求,适用于各类数据展示。...
    packageimg
  • 新闻标题拼写错误数据集100万条

    2025年4月23日   

    新闻标题拼写错误数据集100万条 数据来源:互联网公开数据 标签:拼写错误,新闻标题,自然语言处理,数据生成,拼写校正模型,机器学习,文本处理 数据概述: 本数据集包含通过nlpaug库生成的100万条新闻标题的拼写错误数据。这些标题原本应为正确拼写,但经过处理引入了不同类型的拼写错误,为构建和评估拼写校正模型提供了丰富的训练和测试材料。...
    packageimg
  • 机器学习预处理数据集MLPreprocessingDatasetforPython-jaberimohamedhabib

    2025年4月23日   

    机器学习预处理数据集MLPreprocessingDatasetforPython-jaberimohamedhabib 数据来源:互联网公开数据 标签:机器学习,数据预处理,Python,数据集,数据分析,特征工程,编程,人工智能...
    packageimg
  • Python数据科学与分析基础数据集PythonforDataScience-BasicDataset-valdejuinior

    2025年4月23日   

    Python数据科学与分析基础数据集PythonforDataScience-BasicDataset-valdejuinior 数据来源:互联网公开数据 标签:数据分析,Python编程,数据科学,机器学习,数据处理,教育材料,编程学习,数据集 数据概述:...
    packageimg
  • 深度学习模型源码数据集-2021-sinpcw

    2025年4月23日   

    深度学习模型源码数据集-2021-sinpcw 数据来源:互联网公开数据 标签:深度学习,模型,源码,机器学习,PyTorch,图像处理,分类,分割,License 数据概述: 本数据集包含多个用于深度学习任务的预训练模型源码,旨在为研究人员和开发者提供丰富的模型资源。数据集包括但不限于以下模型: - EfficientNet-PyTorch-...
    packageimg
  • 标签扩展训练数据集LabelExtraTrainingDataset-nguyenvuthanhtung

    2025年4月23日   

    标签扩展训练数据集LabelExtraTrainingDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:标签扩展,训练数据,数据集,机器学习,人工智能,分类任务,深度学习,数据标注 数据概述:该数据集包含来自互联网公开数据的标签扩展训练数据,适用于机器学习和深度学习模型的训练和优化。主要特征如下:...
    packageimg
  • 数据2017年加密货币市场表现分析数据集-datapple

    2025年4月23日   

    2017年加密货币市场表现分析数据集-datapple 数据来源:互联网公开数据 标签:加密货币,市场,市值,交易,价格,比特币,以太坊,区块链,金融,投资 数据概述:...
    packageimg
  • 自动化特征工程演示数据集AutomatedFeatureEngineeringDemoDataset-willkoehrsen

    2025年4月23日   

    自动化特征工程演示数据集AutomatedFeatureEngineeringDemoDataset-willkoehrsen 数据来源:互联网公开数据 标签:特征工程,数据集,机器学习,数据预处理,自动化,数据分析,人工智能,数据科学 数据概述:...
    packageimg
  • 探索多元数据集深入分析与行业应用

    2025年4月23日   

    标题:探索多元数据集深入分析与行业应用 数据内容: 该数据集包含多个字段,涵盖了广泛的数据元素。具体包括: 1. Range 和 Range1-Range17:这些字段代表不同的范围或分类信息,具有从1到36种不同的值,表明数据集覆盖了多个维度的范围划分。 2. Score_URL 和...
    packageimg
  • 代码与数据集整合资源CodesandDatasetIntegratedResource-suprapandey

    2025年4月23日   

    代码与数据集整合资源CodesandDatasetIntegratedResource-suprapandey 数据来源:互联网公开数据 标签:数据集,代码,资源共享,机器学习,数据科学,软件开发,自动化工具,开源资源 数据概述: 该数据集包含来自多种来源的代码与数据集资源,记录了适用于数据科学和机器学习领域的代码实现与配套数据。主要特征如下:...
    packageimg
  • 数据科学核心概念问答数据集-1100--marybrendaakoda

    2025年4月23日   

    数据科学核心概念问答数据集-1100--marybrendaakoda 数据来源:互联网公开数据 标签:数据科学,机器学习,人工智能,问答,面试,知识库,AnalyticsVidhya 数据概述:...
    packageimg
  • 样本列数据集SampleColumnsDataset-avanishgadhikar

    2025年4月23日   

    样本列数据集SampleColumnsDataset-avanishgadhikar 数据来源:互联网公开数据 标签:数据集,数据列,数据分析,数据清洗,机器学习,数据预处理,数据科学,统计学 数据概述:该数据集包含来自多个来源的样本列数据,记录了不同类型的数据列及其属性。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据来源。...
    packageimg
  • 文本预处理与词形还原训练数据集-marouanesidali

    2025年4月23日   

    文本预处理与词形还原训练数据集-marouanesidali 数据来源:互联网公开数据 标签:文本预处理,词形还原,自然语言处理,机器学习,文本分析,数据集,NLP,训练数据 数据概述: 该数据集包含了经过预处理和词形还原的文本数据,主要用于训练和评估自然语言处理模型。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于原始文本数据集的构成。...
    packageimg
  • 垃圾邮件检测数据集-文本分类-2023-aiaiaidavid

    2025年4月23日   

    垃圾邮件检测数据集-文本分类-2023-aiaiaidavid 数据来源:互联网公开数据 标签:垃圾邮件检测,文本分类,机器学习,数据集,训练集,验证集,测试集 数据概述: 本数据集包含三个文件:train.csv、valid.csv 和 test.csv,用于垃圾邮件检测任务。每个文件包含两列:text 和 label。text...
    packageimg