找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 推特情感提取数据集

    2025年4月14日   

    推特情感提取数据集 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,自然语言处理,机器学习,预测建模 数据概述:...
    packageimg
  • 社交媒体用户性别分类分析数据集

    2025年4月14日   

    社交媒体用户性别分类分析数据集 数据来源:互联网公开数据 标签:性别分类,社交媒体分析,用户画像,机器学习,预测模型,数据标注 数据概述: 本数据集用于训练 CrowdFlower AI 性别预测器,包含 20,000...
    packageimg
  • 泰坦尼克号数据集已清洗

    2025年4月14日   

    泰坦尼克号数据集已清洗 数据来源:互联网公开数据 标签:泰坦尼克号,数据清洗,机器学习,数据分析,生存预测,分类模型,Kaggle 数据概述:...
    packageimg
  • 相似性预测数据集

    2025年4月14日   

    相似性预测数据集 数据来源:互联网公开数据 标签:分子相似性,专家评估,化学,预测,机器学习,UCI,数据集 数据概述: 本数据集包含了由专家化学家进行的分子相似性评估记录,适用于预测人类对分子相似性的评价。数据集涵盖了多种分子及其相似性评分,为研究分子相似性提供了可靠的基础。 数据用途概述:...
    packageimg
  • 数据2021-2023年鸟类识别训练标签数据集

    2025年4月14日   

    数据2021-2023年鸟类识别训练标签数据集 数据来源:互联网公开数据 标签:鸟类识别,BirdCLEF,训练数据,CSV文件,数据清洗,机器学习,音频分析 数据概述: 本数据集包含了2021年、2022年和2023年Kaggle BirdCLEF竞赛的组合数据。数据集包含两个CSV文件:train_21_22_23.csv 和...
    packageimg
  • 情感数据集包含中性情绪

    2025年4月14日   

    情感数据集包含中性情绪 数据来源:互联网公开数据 标签:情感分析,NLP,文本情绪检测,机器学习,数据集,中性情绪 数据概述: 本数据集是对Praveen发布的“情感数据集(NLP)”的扩展,增加了中性情绪标签。该数据集包含从Pashupati Gupta发布的“文本情绪检测”数据集中获取的中性情绪标签,为情感分析任务提供了更全面的标注。...
    packageimg
  • 书籍信息数据集

    2025年4月14日   

    书籍信息数据集 数据来源:互联网公开数据 标签:书籍信息,数据清理,数据分类,学习资源,API示例 数据概述: 本书籍信息数据集源自Postman学习API,涵盖了丰富的书籍信息,适用于学习和实践数据清理及分类操作。数据集内容详实,包括书籍的基本信息、分类标签等,为数据处理提供了很好的练习材料。 数据用途概述:...
    packageimg
  • 印度尼西亚邮政编码与行政区划数据集

    2025年4月14日   

    印度尼西亚邮政编码与行政区划数据集 数据来源:互联网公开数据 标签:行政区划,印尼,邮政编码,地理数据,行政区域,乡村,城镇,省级,县级 数据概述:...
    packageimg
  • 内衣批发数据集

    2025年4月14日   

    内衣批发数据集 数据来源:互联网公开数据 标签:内衣批发,市场分析,销售数据,客户信息,库存管理,供应链,SQL练习,数据分析,数据可视化,机器学习 数据概述:...
    packageimg
  • 有毒评论分类数据集

    2025年4月14日   

    有毒评论分类数据集 数据来源:互联网公开数据 标签:有毒评论,自然语言处理,情感分析,文本分类,机器学习,数据标注,内容安全 数据概述:...
    packageimg
  • ICR年龄相关状况识别数据集

    2025年4月14日   

    ICR年龄相关状况识别数据集 数据来源:互联网公开数据 标签:年龄相关状况,数据分析,数据预处理,特征选择,机器学习,数据填充,线性回归,KNNImputer 数据概述:...
    packageimg
  • 亚马逊显示器交易数据集

    2025年4月14日   

    亚马逊显示器交易数据集 数据来源:互联网公开数据 标签:显示器,交易数据,亚马逊,价格预测,特征工程,数据清洗,电子商务 数据概述:...
    packageimg
  • IMDB电影评分及演员信息数据集

    2025年4月14日   

    IMDB电影评分及演员信息数据集 数据来源:互联网公开数据 标签:电影,评分,演员,IMDB,娱乐,影视,数据分析,文本处理 数据概述:...
    packageimg
  • 性别偏见核心指代数据集-职业刻板印象研究-2023

    2025年4月14日   

    性别偏见核心指代数据集-职业刻板印象研究-2023 数据来源:互联网公开数据 标签:性别偏见,核心指代,职业刻板印象,WinoBias,Huggingface,自然语言处理,数据集,科研,教育 数据概述:...
    packageimg
  • 全球素食友好葡萄酒信息数据库-葡萄酒列表2020年3月

    2025年4月14日   

    全球素食友好葡萄酒信息数据库-葡萄酒列表2020年3月 数据来源:互联网公开数据 标签:葡萄酒,素食,饮品,酒精,健康,环保,列表,数据采集 数据概述:...
    packageimg
  • 二手车价格预测竞赛数据集-KaggleCohort4

    2025年4月14日   

    二手车价格预测竞赛数据集-KaggleCohort4 数据来源:互联网公开数据 标签:二手车,价格预测,机器学习,竞赛,汽车,回归分析 数据概述: 本数据集是为Kaggle Cohort 4竞赛生成的,用于二手车价格预测。数据集通过一个深度学习模型生成,该模型在原始的Used Car Price Prediction...
    packageimg
  • Shopify数据科学实习申请者用户行为数据集-2021秋季

    2025年4月14日   

    Shopify数据科学实习申请者用户行为数据集-2021秋季 数据来源:互联网公开数据 标签:Shopify,数据科学,实习,申请,用户行为,电商,机器学习,数据分析 数据概述: 本数据集是Shopify公司2021年秋季数据科学实习申请的一部分,包含了实习申请者相关的数据。该数据集旨在为评估实习申请者的技能和知识提供基础。 数据用途概述:...
    packageimg
  • 收据布局数据集SSD300V2-CSV

    2025年4月14日   

    收据布局数据集SSD300V2-CSV 数据来源:互联网公开数据 标签:收据,布局分析,图像识别,文本提取,深度学习,计算机视觉,数据标注 数据概述:...
    packageimg
  • 墨西哥城投诉记录数据集截至2023年3月

    2025年4月14日   

    墨西哥城投诉记录数据集截至2023年3月 数据来源:互联网公开数据 标签:墨西哥城,投诉记录,公共安全,城市治理,数据清洗,数据质量,社会治理 数据概述:...
    packageimg
  • 医疗元数据集

    2025年4月14日   

    医疗元数据集 数据来源:互联网公开数据 标签:医疗元数据,医学分析,医疗数据集,数据特征工程,医疗统计分析,医疗数据处理 数据概述:...
    packageimg