找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • StackOverflow2019开发者调查数据抽样数据集

    2025年4月15日   

    StackOverflow2019开发者调查数据抽样数据集 数据来源:互联网公开数据 标签:Stack Overflow, 开发者调查, 编程, 软件开发, 数据分析, 开发者, 调查数据, 抽样数据, 2019 数据概述: 本数据集基于Stack Overflow...
    packageimg
  • HMS脑电图音频数据NaN值分析与插补数据集

    2025年4月15日   

    HMS脑电图音频数据NaN值分析与插补数据集 数据来源:互联网公开数据 标签:脑电图,EEG,NaN值,缺失值,数据清洗,插补,音频数据,机器学习,医学,信号处理 数据概述: 本数据集是对HMS(Hms-harmful-medical-events)竞赛中脑电图(EEG)音频数据的NaN值(非数字值)进行分析和处理的结果。...
    packageimg
  • 基因组生物医学事件数据集

    2025年4月15日   

    基因组生物医学事件数据集 数据来源:互联网公开数据 标签:生物医学文本,事件标注,自然语言处理,NLP,药物效果分析,医学条件识别,数据集简化版 数据概述: 本数据集是GENIA事件标注数据集的简化版本,来源于TEES平台,基于BioNLP共享任务2011(BioNLP Shared Task...
    packageimg
  • Python数据分析库Pandas学习实践数据集

    2025年4月15日   

    Python数据分析库Pandas学习实践数据集 数据来源:互联网公开数据 标签:Pandas,数据分析,Python,数据处理,机器学习,数据科学,Notebook,学习资源 数据概述:...
    packageimg
  • 智利Computrabajo招聘信息地理分布数据集

    2025年4月15日   

    智利Computrabajo招聘信息地理分布数据集 数据来源:互联网公开数据 标签:招聘信息,智利,Computrabajo,职位,地理分布,数据抓取,数据清洗,招聘市场分析 数据概述:...
    packageimg
  • 恐怖小说作者识别数据集

    2025年4月15日   

    恐怖小说作者识别数据集 数据来源:互联网公开数据 标签:恐怖小说,作者识别,文本分析,机器学习,自然语言处理 数据概述: 本数据集包含多篇由不同恐怖小说作者撰写的文本样本,旨在用于作者识别任务。数据集涵盖了多位著名恐怖小说作者的作品,每篇文本均标注了相应的作者身份,为研究和开发作者识别模型提供了丰富的训练和测试材料。 数据用途概述:...
    packageimg
  • 随机随机分布数据集

    2025年4月15日   

    随机随机分布数据集 数据来源:互联网公开数据 标签:随机分布,正态分布,均匀分布,指数分布,伽马分布,泊松分布,二项分布,几何分布,对数正态分布,贝塔分布,负二项分布,数据生成,探索性数据分析,教育用途 数据概述:...
    packageimg
  • 虚构电商领域商店数据集

    2025年4月15日   

    虚构电商领域商店数据集 数据来源:互联网公开数据 标签:电商,虚构数据,数据库查询,分析,教学 数据概述: 本数据集为虚构的电商领域商店数据,包含商品信息、客户数据、订单记录等关键要素。该数据集旨在为学习如何创建假数据和查询数据库提供一个实用的示例。 数据用途概述:...
    packageimg
  • 印度互联网仇恨言论识别数据集2023

    2025年4月15日   

    印度互联网仇恨言论识别数据集2023 数据来源:互联网公开数据 标签:仇恨言论,内容审核,文本分析,社交媒体,自然语言处理,人工智能,互联网治理 数据概述: 本数据集用于识别文本输入中是否包含仇恨言论,涵盖了大量的互联网文本样本。数据集旨在为开发和评估仇恨言论检测模型提供训练数据基础,支持对不恰当和有害在线内容进行有效管理。 数据用途概述:...
    packageimg
  • 网络爬虫书籍数据集2023

    2025年4月15日   

    网络爬虫书籍数据集2023 数据来源:互联网公开数据 标签:书籍,网络爬虫,数据分析,分类,推荐系统,数据清洗,Python,bs4,requests 数据概述:...
    packageimg
  • 泰坦尼克号灾难预测数据集

    2025年4月15日   

    泰坦尼克号灾难预测数据集 数据来源:互联网公开数据 标签:泰坦尼克号,灾难预测,机器学习,二分类,生存预测,数据预处理,特征工程 数据概述: 泰坦尼克号灾难预测数据集是一个著名的机器学习二分类问题入门数据集,来源于泰坦尼克号乘客名单,提供了船上个体乘客的信息。该数据集的目标是根据乘客的属性预测其生存的可能性。 数据集包含以下特征: -...
    packageimg
  • 宝可梦数据分析数据集

    2025年4月15日   

    宝可梦数据分析数据集 数据来源:互联网公开数据 标签:宝可梦,数据分析,Python,Pandas,数据科学,教育,入门教程 数据概述: 本数据集基于宝可梦数据集,旨在通过Pandas库进行深入分析。数据集涵盖宝可梦的各项属性,包括名称、类型、能力值等,为数据分析爱好者提供了一个实用的学习和实践资源。 数据用途概述:...
    packageimg
  • 连环杀手维基数据集

    2025年4月15日   

    连环杀手维基数据集 数据来源:互联网公开数据 标签:连环杀手,维基百科,犯罪学,历史,数据清洗,数据分析,教育 数据概述:...
    packageimg
  • 巴西服装市场电商交易数据集2023

    2025年4月15日   

    巴西服装市场电商交易数据集2023 数据来源:互联网公开数据 标签:巴西服装市场,电商交易,在线购物,数据挖掘,机器学习,数据清洗,电子商务 数据概述:...
    packageimg
  • 印度尼西亚语句子数据集

    2025年4月15日   

    印度尼西亚语句子数据集 数据来源:互联网公开数据 标签:Bahasa Indonesia, Sintaksis, Gramatika, Tekstual Analisis, Pembelajaran Mesin, Natural Language Processing, Pendidikan Bahasa 数据概述:...
    packageimg
  • Python数据分析与可视化练习数据集-模拟数据-通用

    2025年4月15日   

    Python数据分析与可视化练习数据集-模拟数据-通用 数据来源:互联网公开数据 标签:Python, NumPy, Pandas, Matplotlib, 数据分析, 数据可视化, 模拟数据, 练习, 数据清洗, 缺失值, 异常值 数据概述:...
    packageimg
  • 全面生物医学实体识别数据集

    2025年4月15日   

    全面生物医学实体识别数据集 数据来源:互联网公开数据 标签:生物医学,实体识别,自然语言处理,机器学习,药物描述,专利摘要,文本分析 数据概述:...
    packageimg
  • 数据集发布说明模版数据集

    2025年4月15日   

    数据集发布说明模版数据集 数据来源:互联网公开数据 数据集说明: 该数据集目前尚未包含具体内容说明,其结构为数据集描述的模版文本,旨在引导数据发布者围绕数据的背景、来源、时间范围和潜在用途进行规范化阐述。这种模版常用于数据共享平台(如 Kaggle、DataHub 等)中,以帮助数据发布者构建完整的“数据故事”,增强数据集的可理解性与复用性。...
    packageimg
  • 土耳其私人停车场会员数据集2023

    2025年4月15日   

    土耳其私人停车场会员数据集2023 数据来源:互联网公开数据 标签:停车场,会员数据,土耳其,汽车信息,测试数据,算法测试,交通分析 数据概述: 本数据集是一个模拟数据集,使用Python...
    packageimg
  • 虚构电子产品公司销售数据分析数据集

    2025年4月15日   

    虚构电子产品公司销售数据分析数据集 数据来源:互联网公开数据 标签:销售数据,电子产品,市场分析,数据清洗,数据分析,销售业绩,产品销量,客户行为 数据概述: 本数据集包含了虚构电子产品公司的销售数据,旨在用于数据分析和数据清洗的实践。...
    packageimg