找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 异常值预测与优化评分数据集-waitingli

    2025年5月29日   

    异常值预测与优化评分数据集-waitingli 数据来源:互联网公开数据 标签:异常值检测,数据清洗,机器学习,评分优化,数据集,数据分析,统计学,模型评估 数据概述:该数据集包含用于异常值预测和优化评分的数据,旨在帮助用户识别和处理数据中的异常值,从而提升模型性能和评分。主要特征如下: 时间跨度:数据记录的时间范围不限,具体取决于数据集本身。...
    packageimg
  • CSV文件样本数据集-matcauthon49

    2025年5月29日   

    CSV文件样本数据集-matcauthon49 数据来源:互联网公开数据 标签:CSV文件,数据样本,数据格式,数据分析,数据处理,测试数据,数据预览,示例数据 数据概述:该数据集包含一系列CSV(逗号分隔值)文件样本,用于演示和测试各种数据分析和处理场景。主要特征如下: 时间跨度:不涉及时间维度,为静态数据样本。...
    packageimg
  • 简化文件数据集ReducedFileDataset-awaiskaggler

    2025年5月29日   

    简化文件数据集ReducedFileDataset-awaiskaggler 数据来源:互联网公开数据 标签:数据文件,简化处理,数据集,文件分析,数据管理,数据清洗,文件格式,数据标准化 数据概述: 该数据集包含经过简化处理的文件数据,适用于文件分析、数据管理和数据清洗等任务。主要特征如下: 时间跨度:数据记录的时间范围从2019年到2022年。...
    packageimg
  • 数据30组输入文件数据集Group30InputFilesDataset-aryansinghchaudhary

    2025年5月29日   

    30组输入文件数据集Group30InputFilesDataset-aryansinghchaudhary 数据来源:互联网公开数据 标签:输入文件,数据集,机器学习,数据处理,数据分析,算法优化,编程竞赛,技术应用 数据概述: 该数据集包含30组输入文件,适用于机器学习和数据处理任务。主要特征如下:...
    packageimg
  • 代码安全检测恶意代码数据集CodeSecurityDetectionMaliciousCodeDataset-pritioli

    2025年5月29日   

    代码安全检测恶意代码数据集CodeSecurityDetectionMaliciousCodeDataset-pritioli 数据来源:互联网公开数据 标签:代码安全, 恶意代码, 文本分类, 机器学习, 源代码分析, 代码检测, 垃圾邮件, 安全防护 数据概述: 该数据集包含从公开渠道收集的源代码片段,用于识别潜在的恶意代码。主要特征如下:...
    packageimg
  • 语言工具错误检测数据集LanguageToolErrorDetectionDataset-liangqiuyuan1

    2025年5月29日   

    语言工具错误检测数据集LanguageToolErrorDetectionDataset-liangqiuyuan1 数据来源:互联网公开数据 标签:自然语言处理,文本分析,错误检测,机器学习,语言工具,数据集,语法检查,文本处理 数据概述:...
    packageimg
  • 科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck

    2025年5月29日   

    科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本分析,语言模型,数据处理,学术研究 数据概述:该数据集包含来自科勒里奇项目(Coleridge...
    packageimg
  • 数据22行数据数据集22-rows-dataset-shannenlatisha

    2025年5月29日   

    22行数据数据集22-rows-dataset-shannenlatisha 数据来源:互联网公开数据 标签:数据集,样本数据,数据分析,数据集分析,数据科学,统计学 数据概述: 该数据集包含来自未知来源的22行数据,记录了不明确的数据内容。主要特征如下: 时间跨度:数据记录的时间范围不明确。 地理范围:数据覆盖的区域不明确。...
    packageimg
  • 大规模预训练模型Transformer代码库测试数据集Large-scalePre-trainedModelTransformerCodebaseTest...

    2025年5月29日   

    大规模预训练模型Transformer代码库测试数据集Large-scalePre-trainedModelTransformerCodebaseTestingDataset-janderchu 数据来源:互联网公开数据 标签:Transformer, 预训练模型, 自然语言处理, 深度学习, 代码库, 测试, 机器学习, 开源 数据概述:...
    packageimg
  • 数据2022年谷歌竞赛机器学习模型训练数据集GoogleChallenge2022MachineLearningModelTrainingDataset-...

    2025年5月29日   

    2022年谷歌竞赛机器学习模型训练数据集GoogleChallenge2022MachineLearningModelTrainingDataset-ilyaryabov 数据来源:互联网公开数据 标签:机器学习,数据集,竞赛,谷歌,教育,培训,数据科学,模型训练 数据概述:该数据集由2022年谷歌竞赛提供,用于机器学习模型的训练和评估。主要特征如下:...
    packageimg
  • 小型数据集Out-Small-SmallDataset-anshikapal

    2025年5月29日   

    小型数据集Out-Small-SmallDataset-anshikapal 数据来源:互联网公开数据 标签:数据集,小型数据,数据分类,数据分析,机器学习,数据科学,基础研究,教学资源 数据概述: 该数据集包含来自多个小型数据集的整合数据,记录了不同领域的基础数据信息。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • 首次测试数据集OurFirstTestDataset-mahdibanii

    2025年5月29日   

    首次测试数据集OurFirstTestDataset-mahdibanii 数据来源:互联网公开数据 标签:测试数据,数据集,基准测试,数据分析,机器学习,基础研究,通用测试 数据概述: 该数据集为首次测试数据集,用于初步的数据处理和分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确。 地理范围:数据覆盖的区域不明确。...
    packageimg
  • 手写数字图像识别数据集HandwrittenNumberImageRecognitionDataset-aymanmaalej

    2025年5月29日   

    手写数字图像识别数据集HandwrittenNumberImageRecognitionDataset-aymanmaalej 数据来源:互联网公开数据 标签:图像识别, 手写数字, OCR, 文本识别, 深度学习, 数据集, 计算机视觉, 模式识别 数据概述:...
    packageimg
  • 初级机器学习训练与测试数据集Level0Train-TestPlaygroundDataset-maxdiazbattan

    2025年5月29日   

    初级机器学习训练与测试数据集Level0Train-TestPlaygroundDataset-maxdiazbattan 数据来源:互联网公开数据 标签:机器学习,训练集,测试集,数据集,模型评估,数据分析,Python,数据预处理 数据概述:...
    packageimg
  • 家庭作业预处理数据集-sebastianarangou

    2025年5月29日   

    家庭作业预处理数据集-sebastianarangou 数据来源:互联网公开数据 标签:预处理数据,数据集,家庭作业,数据清洗,数据分析,机器学习,教育,实践 数据概述: 该数据集包含经过预处理的数据,旨在为家庭作业和学习提供便利。主要特征如下: 时间跨度:不明确,取决于原始数据集的时间范围。 地理范围:不明确,取决于原始数据集的地理范围。...
    packageimg
  • 数据帧构造数据集CreatedDataFramesDataset-anmolshrivastav07

    2025年5月29日   

    数据帧构造数据集CreatedDataFramesDataset-anmolshrivastav07 数据来源:互联网公开数据 标签:数据帧,数据处理,数据集,数据构造,Python,数据分析,机器学习,数据科学 数据概述: 该数据集包含通过编程方式构造的数据帧(DataFrames),记录了多种数据结构和格式。主要特征如下:...
    packageimg
  • 有毒评论清理数据集JigsawToxicCommentCleanData-harits

    2025年5月29日   

    有毒评论清理数据集JigsawToxicCommentCleanData-harits 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,情感分析,垃圾信息,网络安全,数据清理 数据概述: 该数据集包含来自Jigsaw平台的有毒评论数据,记录了网络上具有攻击性、侮辱性或不当内容的评论信息。主要特征如下:...
    packageimg
  • 乱码文本清洗分析数据集GarbledTextCleaningAnalysisDataset-kaushal2896

    2025年5月29日   

    乱码文本清洗分析数据集GarbledTextCleaningAnalysisDataset-kaushal2896 数据来源:互联网公开数据 标签:文本清洗, 数据预处理, 文本分析, 字符编码, 数据质量, 异常检测, 机器学习, 自然语言处理 数据概述: 该数据集包含经过预处理的文本数据,记录了经过编码处理后产生的乱码文本。主要特征如下:...
    packageimg
  • 机器学习应用实例01数据集-s1mulation0ne

    2025年5月29日   

    机器学习应用实例01数据集-s1mulation0ne 数据来源:互联网公开数据 标签:机器学习,数据集,应用实例,模型训练,数据分析,Python,编程实践,案例研究 数据概述:该数据集包含一系列用于机器学习实践的应用实例数据,旨在帮助学习者掌握数据预处理、模型构建、评估等基本技能。主要特征如下:...
    packageimg
  • 斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-mikemollel

    2025年4月29日   

    斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-mikemollel 数据来源:互联网公开数据 标签:斯瓦希里语, 文本分类, 新闻, 多标签分类, 语言学, 自然语言处理, 机器学习, 语料库 数据概述:...
    packageimg