找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 垃圾邮件过滤数据集SpamFilterDataset-jordanhillnmtafe

    2025年4月22日   

    垃圾邮件过滤数据集SpamFilterDataset-jordanhillnmtafe 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,数据集,机器学习,自然语言处理,邮件过滤,信息安全,朴素贝叶斯 数据概述: 该数据集包含大量的电子邮件数据,用于训练和测试垃圾邮件过滤模型。主要特征如下:...
    packageimg
  • 有毒评论检测数据集ToxicCommentDetectionDataset-maksiamiogan

    2025年4月22日   

    有毒评论检测数据集ToxicCommentDetectionDataset-maksiamiogan 数据来源:互联网公开数据 标签:有毒评论,自然语言处理,数据集,机器学习,文本分类,社交媒体,文本分析,人工智能 数据概述:该数据集来自Kaggle社区,主要记录了社交媒体平台上的评论数据,适用于有毒评论检测,文本分类等任务。主要特征如下:...
    packageimg
  • 自然语言处理低序列数据清洗数据集NLPLowSequenceDataCleaningDataset-chadudupubharath

    2025年4月22日   

    自然语言处理低序列数据清洗数据集NLPLowSequenceDataCleaningDataset-chadudupubharath 数据来源:互联网公开数据 标签:自然语言处理,文本清洗,数据集,序列数据,机器学习,文本挖掘,数据预处理,低资源 数据概述:...
    packageimg
  • Pandas数据连接操作演示数据集-mustafagerme

    2025年4月22日   

    Pandas数据连接操作演示数据集-mustafagerme 数据来源:互联网公开数据 标签:数据连接,Pandas,Python,数据分析,数据集,数据处理,数据合并,编程 数据概述: 该数据集包含了用于演示Pandas库中数据连接操作的示例数据。主要特征如下: 时间跨度:数据无时间跨度,为静态示例数据。 地理范围:数据无地理范围,为通用示例数据。...
    packageimg
  • 合成表格数据去重练习数据集-spac84

    2025年4月22日   

    合成表格数据去重练习数据集-spac84 数据来源:互联网公开数据 标签:数据去重,合成数据,数据清洗,Faker,UUID,Python,数据质量,表格数据 数据概述:...
    packageimg
  • 子集数据集SubsetDataset-silaschicha69

    2025年4月22日   

    子集数据集SubsetDataset-silaschicha69 数据来源:互联网公开数据 标签:数据集,子集,数据处理,机器学习,数据清洗,数据分析,采样,数据挖掘 数据概述: 该数据集提供了从更大的数据集中提取的子集数据,用于演示数据处理,机器学习模型训练和数据分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围取决于原始数据集。 地理范围:...
    packageimg
  • 孟买TripAdvisor餐厅评价数据集1963-2021-adrianmcmahon

    2025年4月22日   

    孟买TripAdvisor餐厅评价数据集1963-2021-adrianmcmahon 数据来源:互联网公开数据 标签:餐厅,孟买,评价,旅游,数据分析,用户反馈,美食, TripAdvisor,印度 数据概述:...
    packageimg
  • 缺失值填充数据集-oxymoronic95

    2025年4月22日   

    缺失值填充数据集-oxymoronic95 数据来源:互联网公开数据 标签:数据清洗,缺失值处理,数据集,数据预处理,统计分析,机器学习,数据分析,Python 数据概述: 该数据集包含了经过缺失值处理的数据,用于演示和评估不同的缺失值填充方法。主要特征如下: 时间跨度: 数据集中数据的具体时间范围取决于原始数据集,但通常不涉及特定的时间序列。...
    packageimg
  • 模拟数据数据集SimulatedDataDataset-kglpg2000

    2025年4月22日   

    模拟数据数据集SimulatedDataDataset-kglpg2000 数据来源:互联网公开数据 标签:模拟数据,数据集,数据生成,统计分析,机器学习,数据建模,仿真研究,学术资源 数据概述: 该数据集包含通过模拟生成的数据,记录了多种场景下的模拟数据样本。主要特征如下: 时间跨度:数据记录的时间范围根据模拟需求设定,可覆盖任意时间段。...
    packageimg
  • MNIST手写数字图像数据集含污染数据-RBM模型训练与验证-b04202048

    2025年4月22日   

    MNIST手写数字图像数据集含污染数据-RBM模型训练与验证-b04202048 数据来源:互联网公开数据 标签:MNIST,手写数字识别,RBM,深度学习,图像处理,污染数据,模型训练,机器学习 数据概述:...
    packageimg
  • 虚构网站书籍数据集-2023年-raqeeb24

    2025年4月22日   

    虚构网站书籍数据集-2023年-raqeeb24 数据来源:互联网公开数据 标签:虚构数据,网络爬虫,书籍信息,数据分析,练习数据,教育 数据概述: 本数据集来源于虚构网站Books.toscrape,包含2023年该网站的书籍信息。该数据集主要用于练习从网站抓取数据的技能,所有数据均为虚构,并非真实数据,因此不适合用于任何实际分析或预测。...
    packageimg
  • TensorFlow官方文本数据集概览-imoore

    2025年4月22日   

    TensorFlow官方文本数据集概览-imoore 数据来源:互联网公开数据 标签:TensorFlow, TFDS, 文本数据集, 机器学习, 数据集, 深度学习, 自然语言处理, 预处理 数据概述: 本数据集描述了TensorFlow官方提供的文本数据集集合,这些数据集通过TensorFlow Datasets (TFDS) 接口提供。...
    packageimg
  • 垃圾邮件过滤-电子邮件内容分类数据集-yashpaloswal

    2025年4月22日   

    垃圾邮件过滤-电子邮件内容分类数据集-yashpaloswal 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分类,垃圾邮件,电子邮件,文本数据,机器学习,分类模型,邮件过滤,SPAM,HAM 数据概述:...
    packageimg
  • 拉各斯房地产销售价格数据集2022-eyimofeapinnick

    2025年4月22日   

    拉各斯房地产销售价格数据集2022-eyimofeapinnick 数据来源:互联网公开数据 标签:拉各斯,房地产,销售价格,尼日利亚,房产数据,预测分析,特征工程,城市规划 数据概述: 本数据集收录了2022年尼日利亚拉各斯州4个城市(奥拉尔庄园、莱基、拉各斯等)的房地产销售数据,数据来自尼日利亚房地产公司PropertyPro...
    packageimg
  • 推特言论分类-有害言论与无害言论识别数据集-grodzina

    2025年4月22日   

    推特言论分类-有害言论与无害言论识别数据集-grodzina 数据来源:互联网公开数据 标签:推特,有害言论,无害言论,自然语言处理,NLP,文本分类,社交媒体分析 数据概述:...
    packageimg
  • CSV训练数据集CSVTrainingDataset-mohammadsammour

    2025年4月22日   

    CSV训练数据集CSVTrainingDataset-mohammadsammour 数据来源:互联网公开数据 标签:CSV格式,数据集,机器学习,数据清洗,数据分析,训练集,数据科学,编程 数据概述:该数据集包含来自互联网的CSV格式训练数据,适用于机器学习和数据分析任务。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2021年。...
    packageimg
  • EDA练习数据集DataExplorationandAnalysisExercisesDataset-sureyasubramanian

    2025年4月22日   

    EDA练习数据集DataExplorationandAnalysisExercisesDataset-sureyasubramanian 数据来源:互联网公开数据 标签:数据分析,数据探索,数据集,统计学,机器学习,数据可视化,教育,数据科学 数据概述:...
    packageimg
  • 芝加哥数据科学课程评分作业数据集-202X-graveowicaksana

    2025年4月22日   

    芝加哥数据科学课程评分作业数据集-202X-graveowicaksana 数据来源:互联网公开数据 标签:数据科学,评分作业,Coursera,SQL,数据库,芝加哥,数据清洗,数据分析 数据概述: 本数据集来源于Coursera数据科学课程的评分作业内容,包含了芝加哥数据门户提供的原始数据的子集。为便于在Jupyter...
    packageimg
  • EDA文件分析数据集EDAFilesAnalysisDataset-zubernagani

    2025年4月22日   

    EDA文件分析数据集EDAFilesAnalysisDataset-zubernagani 数据来源:互联网公开数据 标签:数据分析,EDA,文件处理,机器学习,数据挖掘,数据科学,编程,技术支持 数据概述: 该数据集包含来自EDA(Exploratory Data...
    packageimg
  • 物联网组件详细信息数据集-2023-yashpatawarijain

    2025年4月22日   

    物联网组件详细信息数据集-2023-yashpatawarijain 数据来源:互联网公开数据 标签:物联网,组件,描述,应用,规格,技术,ChatGPT,数据集,手动验证 数据概述:...
    packageimg