找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 新手入门机器学习数据集NewbieDataset-parthplc

    2025年4月24日   

    新手入门机器学习数据集NewbieDataset-parthplc 数据来源:互联网公开数据 标签:机器学习,新手入门,数据集,分类,回归,数据预处理,模型训练,Python 数据概述: 该数据集专为机器学习初学者设计,旨在帮助新手快速入门并掌握数据分析和模型构建的基本技能。主要特征如下: 时间跨度:数据记录时间不限,通常为静态数据集。...
    packageimg
  • 数据框比较数据集DataFramesComparisonDataset-rafaelrsp

    2025年4月24日   

    数据框比较数据集DataFramesComparisonDataset-rafaelrsp 数据来源:互联网公开数据 标签:数据框,比较,数据集,数据分析,Python,Pandas,数据处理,机器学习 数据概述: 该数据集包含了多个数据框(DataFrame)的比较信息,主要记录了不同数据框在数据处理,分析和建模过程中的差异。主要特征如下:...
    packageimg
  • 加密货币缺失数据集MissingCryptoDataset-yassinebenzekri

    2025年4月24日   

    加密货币缺失数据集MissingCryptoDataset-yassinebenzekri 数据来源:互联网公开数据 标签:加密货币,数据集,缺失数据,数据清洗,金融科技,机器学习,数据分析,区块链技术 数据概述:该数据集包含来自加密货币领域的缺失数据记录,记录了加密货币交易,价格,市场数据等方面的缺失信息。主要特征如下:...
    packageimg
  • 模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67

    2025年4月24日   

    模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67 数据来源:互联网公开数据 标签:模糊匹配,相似度分析,数据集,自然语言处理,文本匹配,文本处理,数据清洗,人工智能 数据概述: 该数据集包含使用FuzzyWuzzy库进行文本相似度匹配的输出结果,记录了不同文本字符串之间的相似度分数。主要特征如下:...
    packageimg
  • 韩国文本到SQL生成数据集KO-Text2SQL-CleanDataset-cocolabhub

    2025年4月24日   

    韩国文本到SQL生成数据集KO-Text2SQL-CleanDataset-cocolabhub 数据来源:互联网公开数据 标签:文本到SQL,自然语言处理,数据集,数据库,语义解析,机器学习,韩国语,代码生成 数据概述: 该数据集包含韩国语文本及其对应的SQL查询语句,用于训练和评估文本到SQL(Text-to-SQL)生成模型。主要特征如下:...
    packageimg
  • 第二阶段欠采样数据集Stage2UndersampleDataset-amancodes

    2025年4月24日   

    第二阶段欠采样数据集Stage2UndersampleDataset-amancodes 数据来源:互联网公开数据 标签:机器学习,数据集,分类,欠采样,不平衡数据,数据预处理,模型训练,算法评估 数据概述: 该数据集包含经过欠采样处理的数据,主要用于处理不平衡分类问题。主要特征如下:...
    packageimg
  • 卡洛鲁斯智能数据处理后数据集CarolusIntelligenceDataSetAfterPre-processing-carolus174

    2025年4月24日   

    卡洛鲁斯智能数据处理后数据集CarolusIntelligenceDataSetAfterPre-processing-carolus174 数据来源:互联网公开数据 标签:数据集,数据处理,机器学习,人工智能,数据预处理,数据分析,智能分析,信息处理 数据概述: 该数据集来源于卡洛鲁斯智能项目,记录了经过预处理的智能数据。主要特征如下:...
    packageimg
  • 乌尔都语命名实体识别数据集UrduNERDataset-themohal

    2025年4月24日   

    乌尔都语命名实体识别数据集UrduNERDataset-themohal 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,语言技术,乌尔都语,实体识别 数据概述: 该数据集包含乌尔都语文本中的命名实体识别数据,记录了乌尔都语文本中的人名,地名,组织名等实体信息。主要特征如下:...
    packageimg
  • Quora问题重复检测预处理数据集QuoraQuestionDuplicationPreprocessingDataset-khaiurl

    2025年4月24日   

    Quora问题重复检测预处理数据集QuoraQuestionDuplicationPreprocessingDataset-khaiurl 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,分类任务,问答系统,重复检测,文本预处理 数据概述:...
    packageimg
  • 低准确率分类数据集-airtonsenna

    2025年4月24日   

    低准确率分类数据集-airtonsenna 数据来源:互联网公开数据 标签:分类,机器学习,数据集,图像识别,模型评估,人工智能,计算机视觉,噪声数据 数据概述: 该数据集包含用于评估和研究低准确率分类模型的图像数据。主要特征如下: 时间跨度:数据记录的时间范围不明确,但可能涵盖了模型训练和测试所需的历史数据。...
    packageimg
  • 机器学习课程作业一数据集MachineLearningCoursework1Dataset-sc22zl

    2025年4月24日   

    机器学习课程作业一数据集MachineLearningCoursework1Dataset-sc22zl 数据来源:互联网公开数据 标签:机器学习,数据集,分类,预测,Python,数据分析,模型评估,学术研究 数据概述: 该数据集包含用于机器学习课程作业一的数据,主要用于训练和评估分类模型。主要特征如下:...
    packageimg
  • 准备到CSV集成数据集PreparetoCSVEnsembleDataset-bae9509

    2025年4月24日   

    准备到CSV集成数据集PreparetoCSVEnsembleDataset-bae9509 数据来源:互联网公开数据 标签:数据集成,CSV格式,数据处理,机器学习,数据科学,数据清洗,数据分析,数据共享 数据概述: 该数据集包含多个来源的数据,已经整合并转换为CSV格式,便于进行数据分析和机器学习任务。主要特征如下:...
    packageimg
  • 自然语言处理实践竞赛数据集NLPinPracticeCompetitionDataset-e0xextazy

    2025年4月24日   

    自然语言处理实践竞赛数据集NLPinPracticeCompetitionDataset-e0xextazy 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分类,数据集,机器学习,竞赛,文本分析,人工智能 数据概述: 该数据集包含来自自然语言处理实践竞赛的数据,记录了用于文本分类任务的文本数据。主要特征如下:...
    packageimg
  • 匿名化数据处理数据集AnonymizedDatasets-pernilleklevstuen

    2025年4月24日   

    匿名化数据处理数据集AnonymizedDatasets-pernilleklevstuen 数据来源:互联网公开数据 标签:数据匿名化,隐私保护,数据集,数据处理,信息安全,机器学习,数据科学,合规性 数据概述: 该数据集包含经过匿名化处理的各类数据记录,记录了不同领域的数据在保护隐私前提下的处理方式与结果。主要特征如下:...
    packageimg
  • 训练集修剪与检查数据集TrimmedTrainingandCheckingDataset-aymenabb

    2025年4月24日   

    训练集修剪与检查数据集TrimmedTrainingandCheckingDataset-aymenabb 数据来源:互联网公开数据 标签:数据集,机器学习,数据预处理,模型训练,数据修剪,数据检查,算法优化,人工智能 数据概述:该数据集包含经过修剪的训练数据和相应的检查数据,用于模型训练前的数据准备和验证。主要特征如下:...
    packageimg
  • 伦敦数据科学竞赛DataScienceLondon机器学习数据集DataScienceLondonScikit-learnDataset-newman123

    2025年4月24日   

    伦敦数据科学竞赛DataScienceLondon机器学习数据集DataScienceLondonScikit-learnDataset-newman123 数据来源:互联网公开数据 标签:数据科学,机器学习,数据集,竞赛数据,分类算法,回归分析,算法评估,人工智能...
    packageimg
  • 土耳其命名实体识别数据集

    2025年4月24日   

    土耳其命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,土耳其语,自然语言处理,机器学习,数据标注 数据概述:...
    packageimg
  • Python数据入门数据集IntrotoPythonDataDataset-alexbushnell

    2025年4月24日   

    Python数据入门数据集IntrotoPythonDataDataset-alexbushnell 数据来源:互联网公开数据 标签:数据科学,Python,数据集,编程学习,数据分析,机器学习,教育资源,基础入门 数据概述: 该数据集旨在为初学者提供Python数据处理的入门实践,记录了基础的Python数据处理示例和数据结构。主要特征如下:...
    packageimg
  • 合成数据集用于提升算法性能SyntheticDatasetforBoostingPerformance-korcy78

    2025年4月24日   

    合成数据集用于提升算法性能SyntheticDatasetforBoostingPerformance-korcy78 数据来源:互联网公开数据 标签:机器学习,数据集,提升算法,合成数据,分类任务,回归分析,算法优化,数据增强 数据概述: 该数据集是为提升算法性能而设计的合成数据集,主要用于机器学习分类和回归任务。主要特征如下:...
    packageimg
  • 亚马逊OCR数据集AmazonOCRDataset-sivashanks

    2025年4月24日   

    亚马逊OCR数据集AmazonOCRDataset-sivashanks 数据来源:互联网公开数据 标签:光学字符识别,OCR,数据集,图像处理,深度学习,文本识别,亚马逊,计算机视觉 数据概述: 该数据集包含来自亚马逊的OCR(光学字符识别)数据,主要用于训练和评估OCR模型的性能。主要特征如下:...
    packageimg