找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 词汇意义消歧WordSenseDisambiguation数据集Word-Sense-Disambiguation-WSD-Dataset-with-Se...

    2025年4月25日   

    词汇意义消歧WordSenseDisambiguation数据集Word-Sense-Disambiguation-WSD-Dataset-with-Senses-shreyswan 数据来源:互联网公开数据 标签:自然语言处理,词汇意义消歧,数据集,语言建模,文本分析,语义理解,机器学习,语言学 数据概述:...
    packageimg
  • Kaggle新手测试数据集KaggleBeginningTestDataset-caurus

    2025年4月25日   

    Kaggle新手测试数据集KaggleBeginningTestDataset-caurus 数据来源:互联网公开数据 标签:数据集,Kaggle,测试数据,数据分析,机器学习,数据科学,初学者,实践练习 数据概述: 该数据集是Kaggle平台提供的用于新手测试的数据集,记录了适合初学者练习和分析的基础数据。主要特征如下:...
    packageimg
  • 瑞典餐饮业破产数据集

    2025年4月25日   

    瑞典餐饮业破产数据集 数据来源:互联网公开数据 标签:瑞典, 餐饮业, 破产预测, 机器学习, 数据不平衡, 金融分析, 行业研究 数据概述:...
    packageimg
  • PythonPandas入门数据集PythonPandasIntroductionDatasets-mielek

    2025年4月25日   

    PythonPandas入门数据集PythonPandasIntroductionDatasets-mielek 数据来源:互联网公开数据 标签:Python,Pandas,数据集,数据分析,数据处理,入门,教程,机器学习,CSV 数据概述: 该数据集包含一系列用于Python...
    packageimg
  • 清洁预测数据分析数据集-omarelkholy74

    2025年4月25日   

    清洁预测数据分析数据集-omarelkholy74 数据来源:互联网公开数据 标签:数据清洗,预测分析,数据集,机器学习,数据质量,数据预处理,统计分析,异常检测 数据概述: 该数据集包含用于预测分析的数据,记录了经过清洗和预处理后的数据信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,具体取决于原始数据。...
    packageimg
  • 逻辑回归基础数据集LogisticRegressionBasicDataset-lixysc

    2025年4月25日   

    逻辑回归基础数据集LogisticRegressionBasicDataset-lixysc 数据来源:互联网公开数据 标签:逻辑回归,数据集,机器学习,分类算法,统计学习,二分类,数据建模,算法验证 数据概述: 该数据集是一个专门为逻辑回归算法设计的基准数据集,主要包含用于二分类问题的特征和标签数据。主要特征如下:...
    packageimg
  • ARH数据测试数据集ARHDataTestingDataset-n3onnhowever

    2025年4月25日   

    ARH数据测试数据集ARHDataTestingDataset-n3onnhowever 数据来源:互联网公开数据 标签:数据分析,测试数据,数据集,质量控制,统计方法,数据验证,数据科学,机器学习 数据概述: 该数据集包含来自ARH(高级风险评估与建模)项目的测试数据,用于评估和验证数据分析方法及模型的有效性。主要特征如下:...
    packageimg
  • 数据科学与Pandas应用数据集GDSCDataSciencePandasDataset-mohamed56668999898

    2025年4月25日   

    数据科学与Pandas应用数据集GDSCDataSciencePandasDataset-mohamed56668999898 数据来源:互联网公开数据 标签:数据科学,Pandas,数据分析,数据处理,机器学习,编程,数据集,Python...
    packageimg
  • UnivAI黑客松数据集UnivAIHackathonDataset-manasdalakoti

    2025年4月25日   

    UnivAI黑客松数据集UnivAIHackathonDataset-manasdalakoti 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,情感分析,机器翻译,机器学习,人工智能,文本挖掘 数据概述: 该数据集包含来自UnivAI黑客松活动的数据,记录了参赛者在活动中生成和处理的文本数据。主要特征如下:...
    packageimg
  • 标准数据集StandardDataDataset-ghaithkhlifi

    2025年4月25日   

    标准数据集StandardDataDataset-ghaithkhlifi 数据来源:互联网公开数据 标签:标准数据,数据集,数据处理,统计分析,机器学习,数据验证,数据科学,质量控制 数据概述: 该数据集包含来自多个来源的标准数据,记录了经过规范化处理的数据样本。主要特征如下: 时间跨度:数据记录的时间范围从不同年份的汇总数据。...
    packageimg
  • 数据预处理示例数据集DataPreparationExampleDataset-omidsakaki1370

    2025年4月25日   

    数据预处理示例数据集DataPreparationExampleDataset-omidsakaki1370 数据来源:互联网公开数据 标签:数据预处理,数据集,数据清洗,机器学习,数据分析,数据工程,数据科学,算法开发 数据概述:该数据集包含用于数据预处理和清洗的示例数据,记录了原始数据的常见问题和处理方法。主要特征如下:...
    packageimg
  • 古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit

    2025年4月25日   

    古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit 数据来源:互联网公开数据 标签:自然语言处理,词性标注,古吉拉特语,数据集,语言技术,机器学习,文本分析,多语言处理 数据概述:...
    packageimg
  • 零分与满分数据排除分析数据集Omitting0and1ScoresDataset-ethangonsalves998

    2025年4月25日   

    零分与满分数据排除分析数据集Omitting0and1ScoresDataset-ethangonsalves998 数据来源:互联网公开数据 标签:数据分析,评分系统,数据清洗,机器学习,教育评估,统计方法,数据处理,评分标准化 数据概述:...
    packageimg
  • 验证文件数据集ValidationFilesDataset-chris1245

    2025年4月25日   

    验证文件数据集ValidationFilesDataset-chris1245 数据来源:互联网公开数据 标签:数据验证,文件检查,数据集,质量控制,数据分析,数据清洗,数据管理,信息技术 数据概述: 该数据集包含用于验证和检查数据质量的文件集合,记录了数据验证过程中的关键文件和指标。主要特征如下:...
    packageimg
  • 数据清洗后通用数据集DataAfterSomeCleaningDataset-mshaheernadeem

    2025年4月25日   

    数据清洗后通用数据集DataAfterSomeCleaningDataset-mshaheernadeem 数据来源:互联网公开数据 标签:数据清洗,数据集,数据处理,机器学习,数据分析,数据质量,数据科学,数据工程 数据概述:...
    packageimg
  • Pandas基础教程数据集PandasBasicsDataset-revanthkundina

    2025年4月25日   

    Pandas基础教程数据集PandasBasicsDataset-revanthkundina 数据来源:互联网公开数据 标签:Pandas, 数据处理, 数据分析, 编程教程, 数据科学, 数据清洗, 数据探索, 数据可视化 数据概述:...
    packageimg
  • 预标注使用GPT数据集Pre-labelingUsingGPTDataset-lordix

    2025年4月25日   

    预标注使用GPT数据集Pre-labelingUsingGPTDataset-lordix 数据来源:互联网公开数据 标签:自然语言处理,预标注,GPT模型,数据集,机器学习,文本分析,人工智能,数据增强 数据概述: 该数据集包含了利用GPT模型进行预标注的文本数据,记录了GPT模型对不同类型文本的标注结果。主要特征如下:...
    packageimg
  • 真实数据标签数据集RealDataLabelDataset-krealdata

    2025年4月25日   

    真实数据标签数据集RealDataLabelDataset-krealdata 数据来源:互联网公开数据 标签:数据集,数据标注,机器学习,人工智能,数据科学,模型训练,数据管理,数据质量 数据概述: 该数据集包含来自多个领域的真实数据及其对应标签,记录了各类数据的原始信息和分类或标记结果。主要特征如下:...
    packageimg
  • 垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u

    2025年4月25日   

    垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,电子邮件,文本分类,自然语言处理,机器学习,文本分析,信息检索 数据概述: 该数据集包含来自公开邮箱的垃圾邮件(Spam)和正常邮件(Ham)数据,用于训练和评估垃圾邮件检测模型。主要特征如下:...
    packageimg
  • 阿拉伯语拼写数据集SpellArabicDataset-twproject

    2025年4月25日   

    阿拉伯语拼写数据集SpellArabicDataset-twproject 数据来源:互联网公开数据 标签:阿拉伯语,拼写检查,数据集,自然语言处理,文本分析,机器学习,语言技术,语言学 数据概述:该数据集包含来自互联网的阿拉伯语文本数据,记录了阿拉伯语拼写错误及其正确拼写的对应关系。主要特征如下:...
    packageimg