找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 全球最受欢迎前5000张专辑数据集截至2021年10月

    2025年4月14日   

    全球最受欢迎前5000张专辑数据集截至2021年10月 数据来源:互联网公开数据 标签:音乐,专辑,排行榜,用户评价,数据清理,数据分析 数据概述:...
    packageimg
  • 健身房数据集

    2025年4月14日   

    健身房数据集 数据来源:互联网公开数据 标签:健身房,数据处理,ETL,SSIS,SQL Server,Power BI,API集成 数据概述: 本数据集包含一个完整的ETL(数据抽取、转换和加载)过程,使用SQL Server Integration Services (SSIS)从GitHub上的CSV文件抽取数据,清理并转换后加载到SQL...
    packageimg
  • 美国西雅图房产数据集

    2025年4月14日   

    美国西雅图房产数据集 数据来源: 互联网公开数据 标签: 房产价格预测, 数据清洗, 监督学习, 线性回归, 多重共线性, 时间序列, 美国西雅图, 数据分析, 机器学习 数据概述:...
    packageimg
  • 电影评论情感分析数据集-电影评论情感分析-2010

    2025年4月14日   

    电影评论情感分析数据集-电影评论情感分析-2010 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,NLP,情感分类,文本数据,电影,影评 数据概述:...
    packageimg
  • IBOVESPA指数成分股数据集1963-2021

    2025年4月14日   

    IBOVESPA指数成分股数据集1963-2021 数据来源:互联网公开数据 标签:IBOVESPA,股票市场,金融分析,成分股,数据清理,时间序列,投资研究 数据概述:...
    packageimg
  • 基于症状的疾病标注数据集

    2025年4月14日   

    基于症状的疾病标注数据集 数据来源:互联网公开数据 标签:症状标注,疾病诊断,NLP,医疗应用,健康数据,自然语言处理 数据概述:...
    packageimg
  • 基于DeLP程序生成器的程序参数基准数据集

    2025年4月14日   

    基于DeLP程序生成器的程序参数基准数据集 数据来源:互联网公开数据 标签:DeLP,程序生成,参数,基准,人工智能,逻辑编程,知识表示,数据生成 数据概述: 本数据集包含了用于合成生成DeLP程序的参数值。这些参数被用于DeLP程序生成器(DPG, DeLP Program...
    packageimg
  • 数据100万员工合成数据集

    2025年4月14日   

    数据100万员工合成数据集 数据来源:互联网公开数据 标签:员工数据,合成数据,Faker库,Python,测试数据,数据生成,数据隐私 数据概述:...
    packageimg
  • 数学竞赛问题集-SigmaDolphin数据集筛选与清洗-AIME与AMC场景-2013至今

    2025年4月14日   

    数学竞赛问题集-SigmaDolphin数据集筛选与清洗-AIME与AMC场景-2013至今 数据来源:互联网公开数据 标签:数学,问题求解,自然语言处理,人工智能,AIME,AMC,竞赛,文本数据,筛选,清洗 数据概述: 本数据集是对Sigma...
    packageimg
  • 笔记本电脑产品特征与规格数据集-基于MySQL数据清洗

    2025年4月14日   

    笔记本电脑产品特征与规格数据集-基于MySQL数据清洗 数据来源:互联网公开数据 标签:笔记本电脑,产品规格,技术参数,市场分析,数据清洗,MySQL,产品特征 数据概述:...
    packageimg
  • 航空事故与事件数据集

    2025年4月14日   

    航空事故与事件数据集 数据来源:互联网公开数据 标签:航空安全,事故记录,行业分析,数据清洗,探索性数据分析,航空事故数据库,FAA,NTSB,WAAS 数据概述...
    packageimg
  • 尼泊尔事实性问题意图分类数据集

    2025年4月14日   

    尼泊尔事实性问题意图分类数据集 数据来源:互联网公开数据 标签:尼泊尔,自然语言处理,问题分类,问答系统,知识库,教育,语言学 数据概述: 本数据集收录了从尼泊尔一般知识书籍中收集的事实性问题,并根据开发的分类体系进行了标注。数据集包括了不同类别和意图的问题,旨在为尼泊尔自然语言处理领域的问答系统提供基础数据支持。 数据用途概述:...
    packageimg
  • MercadoLibre阿根廷汽车发布价格数据集

    2025年4月14日   

    MercadoLibre阿根廷汽车发布价格数据集 数据来源:互联网公开数据 标签:汽车销售, MercadoLibre阿根廷, 数据清洗, 探索性数据分析, 机器学习, 汽车价格, 汽车品牌, 汽车型号, 发动机类型 数据概述:...
    packageimg
  • Google不安全搜索提示数据集

    2025年4月14日   

    Google不安全搜索提示数据集 数据来源:互联网公开数据 标签:AI 模型, 数据安全, 风险评估, 内容过滤, 不安全提示, 道德风险, 法律合规, 内容审核 数据概述:...
    packageimg
  • 二分类问题数据集

    2025年4月14日   

    二分类问题数据集 数据来源:互联网公开数据 标签:二分类,机器学习,特征工程,监督学习,分类模型,数据预测,数据科学,数据分析 数据概述:...
    packageimg
  • 美国NHANES2009年人体测量数据集

    2025年4月14日   

    美国NHANES2009年人体测量数据集 数据来源:互联网公开数据 标签:人体测量,美国,NHANES,健康状况,饮食状况,疾病风险,身体成分,成人健康,数据科学,数据分析 数据概述:...
    packageimg
  • 网络仇恨言论检测数据集1963-2021

    2025年4月14日   

    网络仇恨言论检测数据集1963-2021 数据来源:互联网公开数据 标签:网络仇恨言论,网络欺凌,文本分类,社交媒体,数据融合,数据分析 数据概述:...
    packageimg
  • 数据分析中的错误与非关系型表格BENTA数据集

    2025年4月14日   

    数据分析中的错误与非关系型表格BENTA数据集 数据来源:互联网公开数据 标签:错误检测,非关系表,数据分析,基准测试,数据质量,数据清洗,数据管理 数据概述:...
    packageimg
  • 垃圾邮件与正常邮件在推特评论中的数据集

    2025年4月14日   

    垃圾邮件与正常邮件在推特评论中的数据集 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,推特评论,特征分析,电子邮件分类,文本分析,社交媒体分析 数据概述: 本数据集收录了推特评论中收到的垃圾邮件和正常邮件的记录。数据集涵盖了大量推特评论样本,标注了每条评论是否包含垃圾邮件或正常邮件,为研究垃圾邮件特征和正常邮件特征提供了宝贵的数据基础。...
    packageimg
  • 机器学习基础入门数据集

    2025年4月14日   

    机器学习基础入门数据集 数据来源:互联网公开数据 标签:机器学习,基础入门,监督学习,非监督学习,数据集,模型评估,特征工程,偏差方差权衡 数据概述:...
    packageimg