找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 公司详情数据集

    2025年4月15日   

    公司详情数据集 数据来源:互联网公开数据 标签:公司,行业,薪资,回归模型,数据清洗,实践练习 数据概述: 本数据集包含了多家公司提供的职位详情信息,包括其所处的行业领域及相应的薪资水平。数据集涵盖了多个行业的职位信息,旨在为用户提供一个练习和改进数据清洗技能的平台,同时也适合用于回归模型的构建和训练。 数据用途概述:...
    packageimg
  • 多标签分类器应用数据集1963-2021

    2025年4月15日   

    多标签分类器应用数据集1963-2021 数据来源:互联网公开数据 标签:多标签分类,应用描述,应用类别,数据集,分类模型,机器学习 数据概述:...
    packageimg
  • SPIKE-QA问答数据集

    2025年4月15日   

    SPIKE-QA问答数据集 数据来源:互联网公开数据 标签:问答数据集,GPT4o-small,零样本学习,基础科学,复杂问题,日常聊天,Excel,CSV 数据概述: SPIKE-...
    packageimg
  • 西班牙语有毒评论分析数据集

    2025年4月15日   

    西班牙语有毒评论分析数据集 数据来源:互联网公开数据 标签:有毒评论,文本分析,自然语言处理,机器学习,多语言数据,情感分析,社交媒体分析 数据概述: 本数据集由两个原始数据集合并并翻译成西班牙语而成。第一个数据集来自Kaggle的Jigsaw有毒评论分类挑战赛,包含标记为有毒或非有毒的英语评论。第二个数据集来自PAN 21...
    packageimg
  • 模拟排序测试数据集

    2025年4月15日   

    模拟排序测试数据集 数据来源:互联网公开数据 标签:测试数据,排序算法,随机生成,假数据,用户信息 数据概述:...
    packageimg
  • Fitbit用户健身数据分析数据集-个人活动监测-时间跨度未知

    2025年4月15日   

    Fitbit用户健身数据分析数据集-个人活动监测-时间跨度未知 数据来源:互联网公开数据 标签:Fitbit,健身数据,用户行为,活动监测,步数,心率,睡眠,健康,数据分析 数据概述:...
    packageimg
  • 德国虚构公司数据集

    2025年4月15日   

    德国虚构公司数据集 数据来源:互联网公开数据 标签:虚构公司,德国,公司名称,法律形式,街道名称,邮政编码,地理位置 数据概述: 本数据集包含2,000家虚构公司的信息,每家公司都有常见的公司名称、法律形式、街道名称以及对应的邮政编码和所在城市。该数据集由数据研究者创建,最初用于生成虚假的求职申请,其中需要插入虚构的公司信息以充实简历内容。...
    packageimg
  • 数据字典1

    2025年4月15日   

    数据字典1 数据来源:互联网公开数据 标签:数据字典,信息采样,数据定义,字段说明,数据标准,术语解释,数据管理 数据概述: 本数据集包含了一套详尽的数据字典信息,涵盖了多个数据集或数据源中的字段定义、数据类型、数据范围、有效值、描述信息等关键要素。数据字典为数据使用者提供了理解和解释数据的基础,确保数据的一致性和准确性。 数据用途概述:...
    packageimg
  • 心脏疾病欠采样数据集

    2025年4月15日   

    心脏疾病欠采样数据集 数据来源:互联网公开数据 标签:心脏疾病,欠采样,近邻算法,数据不平衡,机器学习模型,统计分析,假设检验 数据概述:...
    packageimg
  • 巴基斯坦医生数据集

    2025年4月15日   

    巴基斯坦医生数据集 数据来源:互联网公开数据 标签:医生,巴基斯坦,医疗保健,专业人员,专科医生,地理位置,医疗费用 数据概述: 巴基斯坦医生数据集提供了该国医疗专业人员的详细概况,涵盖了各种专科医生在不同地点的信息。数据集包括医生的姓名、职称、专科领域、执业地点及咨询费用等关键信息,为寻求医疗服务的患者提供了识别合格医生的重要资源。 数据用途概述:...
    packageimg
  • 分区行政区划数据集

    2025年4月15日   

    分区行政区划数据集 数据来源:互联网公开数据 标签:行政区划,分区,城市,国家,数据清理,Guftugu Publication,巴基斯坦,国际国家 数据概述: 本数据集用于清理Guftugu...
    packageimg
  • 机器故障数据集

    2025年4月15日   

    机器故障数据集 数据来源:互联网公开数据 标签:机器故障,预测分析,工业维护,传感器数据,机器学习,异常检测 数据概述: 本数据集包含轻量级的机器故障记录,涵盖了58个未命名的机器参数,以及一个二进制值用于指示机器是否发生故障。该数据集为研究机器故障预测和维护提供了基础信息。 数据用途概述:...
    packageimg
  • 肥胖数据分析数据集

    2025年4月15日   

    肥胖数据分析数据集 数据来源:互联网公开数据 标签:肥胖,饮食习惯,身体状况,机器学习,特征工程,健康数据,数据预处理 数据概述: 本数据集基于UCI Estimation of Obesity Levels Based on Eating Habits and Physical Condition数据集整理而成,包含3个文件: 1....
    packageimg
  • 初学者数据抓取练习数据集

    2025年4月15日   

    初学者数据抓取练习数据集 数据集说明: 本数据集由作者在学习过程中构建,目的是实践如何从 Kaggle、FRED(Federal Reserve Economic Data)以及其他网站抓取和整理数据。该数据集作为编码初学者的练习成果,可能包含多个来源的样例数据,用于探索数据抓取、API使用、数据清洗与整理等技能。...
    packageimg
  • 英译印语言模型指令数据集-NVIDIAHelpSteer数据集-英译印

    2025年4月15日   

    英译印语言模型指令数据集-NVIDIAHelpSteer数据集-英译印 数据来源:互联网公开数据 标签:语言模型,自然语言处理,机器翻译,印地语,文本生成,指令,NVIDIA,HelpSteer,数据集 数据概述: 本数据集是NVIDIA...
    packageimg
  • 酒店评论分析数据集

    2025年4月15日   

    酒店评论分析数据集 数据来源:互联网公开数据 标签:酒店评论,客户满意度,文本分析,旅游行业,情感分析,用户反馈,服务质量 数据概述: 本数据集包含10,000条酒店评论,数据来源于 Hotels.com 和 TripAdvisor...
    packageimg
  • IS463应用数据科学项目数据集

    2025年4月15日   

    IS463应用数据科学项目数据集 数据来源:互联网公开数据 标签:IS463,应用数据科学,项目数据,学生作品,Kaggle数据集 数据概述:...
    packageimg
  • 印度网络言论仇恨言论分类数据集2023

    2025年4月15日   

    印度网络言论仇恨言论分类数据集2023 数据来源:互联网公开数据 标签:仇恨言论,网络言论,文本分类,机器学习,算法模型,社交媒体分析,内容审查 数据概述:...
    packageimg
  • 印度学术成功研究清理数据集1963-2021

    2025年4月15日   

    印度学术成功研究清理数据集1963-2021 数据来源:互联网公开数据 标签:学术成功,印度,学生,辍学预测,数据清理,机器学习,特征工程 数据概述: 本数据集是针对学术成功预测竞赛生成的清洗版本,来源于“Predict Students' Dropout and Academic...
    packageimg
  • 超义关系数据集

    2025年4月15日   

    超义关系数据集 数据来源:互联网公开数据 标签:超义关系,自然语言处理,NLP,词汇语义,知识库,机器学习,神经网络,WordNet,DBPedia,Wikidata,Yago 数据概述:...
    packageimg