找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 纳什维尔房地产交易市场交易数据清洗数据集

    2025年4月15日   

    纳什维尔房地产交易市场交易数据清洗数据集 数据来源:互联网公开数据 标签:房地产,纳什维尔,房屋销售,数据清洗,房价分析,地理位置,交易记录 数据概述: 本数据集源自Kaggle公开的纳什维尔房地产交易数据,经过清洗和转换处理,更易于分析。原始数据经过以下处理: 1. 为每行添加了行尾符(\n)。 2....
    packageimg
  • 合成数学多选题数据集

    2025年4月15日   

    合成数学多选题数据集 数据来源:互联网公开数据 标签:合成数据,数学题,多选题,教育技术,数学误解,检索模型,重排序模型 数据概述: 本数据集包含了EEDI竞赛数据以及约10,000道合成的数学多选题,旨在用于训练检索器和重排序器,以检测给定错误答案中的数学误解。该数据集与“eedi-mcq-...
    packageimg
  • CPU规格数据集

    2025年4月15日   

    CPU规格数据集 数据来源:互联网公开数据 标签:CPU规格,ARM架构,苹果M系列,移动CPU,频率,核心数,功耗,发布时间,基准测试,数据清洗,研究用途 数据概述:...
    packageimg
  • 哥伦比亚1970-2010绑架事件数据集

    2025年4月15日   

    哥伦比亚1970-2010绑架事件数据集 数据来源:互联网公开数据 标签:绑架事件,哥伦比亚,历史数据,时间序列,社会治安,数据分析,数据清理 数据概述:...
    packageimg
  • 中文有毒语言数据集

    2025年4月15日   

    中文有毒语言数据集 数据来源:互联网公开数据 标签:中文,有毒语言,文本分析,机器学习,自然语言处理,伦理问题,多级分类,基准测试 数据概述:...
    packageimg
  • KagglePlaygroundSeason4Episode9公开提交作品融合数据集-2024年9月

    2025年4月15日   

    KagglePlaygroundSeason4Episode9公开提交作品融合数据集-2024年9月 数据来源:互联网公开数据 标签:Kaggle, Playground, 竞赛, 机器学习, 数据集, 汽车, 预测, 融合 数据概述: 本数据集是为Kaggle Playground Season 4 Episode...
    packageimg
  • 回归数据集

    2025年4月15日   

    回归数据集 数据来源:互联网公开数据 标签:回归分析,机器学习,特征工程,数据预测,目标变量 数据概述: 本数据集包含4个特征和1个目标变量。特征包括Feature1、Feature2、Feature3和Feature4,目标变量为Target。该数据集旨在通过给定的特征预测目标变量的值。 数据用途概述:...
    packageimg
  • 数据清洗初学者入门数据集

    2025年4月15日   

    数据清洗初学者入门数据集 数据来源:互联网公开数据 标签:数据清洗,数据操作,pandas,Python,数据分析,编程入门,数据科学 数据概述:...
    packageimg
  • 德黑兰房屋出售广告数据集

    2025年4月15日   

    德黑兰房屋出售广告数据集 数据来源:互联网公开数据 标签:房屋出售,德黑兰,伊朗,房地产,数据抓取,自然语言处理,NLP,原始数据 数据概述:...
    packageimg
  • 上海2023年房产租赁数据集

    2025年4月15日   

    上海2023年房产租赁数据集 数据来源:互联网公开数据 标签:上海,房产租赁,数据清洗,租金预测,房地产市场,2023年 数据概述: 本数据集来源于2023年4月从上海房产网站https://sh.5i5j.com/抓取的房产租赁信息,包含了2023年上海地区的租房数据。数据集保持原始状态,未经清洗和翻译,为用户提供了一个真实且未处理的数据样本。...
    packageimg
  • NSL-KDD网络安全分类数据集

    2025年4月15日   

    NSL-KDD网络安全分类数据集 数据来源:互联网公开数据 标签:网络安全,分类模型,数据预处理,二分类,多分类 数据概述: 本数据集是NSL-KDD数据集的预处理版本,适用于二分类和多分类的网络安全研究。数据集包含了经过清洗和预处理的网络流量记录,每条记录包含多个特征,用于识别和分类不同类型的网络攻击。 数据用途概述:...
    packageimg
  • 数据4000台笔记本电脑数据集

    2025年4月15日   

    数据4000台笔记本电脑数据集 数据来源:互联网公开数据 标签:笔记本电脑,电子设备,数据清洗,特征选择,聚类分析,产品推荐,数据可视化 数据概述:...
    packageimg
  • 墨尔本餐厅外卖数据集

    2025年4月15日   

    墨尔本餐厅外卖数据集 数据来源:互联网公开数据 标签:外卖数据,餐厅运营,墨尔本,地理信息,订单分析,顾客行为,数据清洗,异常检测 数据概述...
    packageimg
  • 成人普查收入数据集

    2025年4月15日   

    成人普查收入数据集 数据来源:互联网公开数据 标签:普查数据,收入预测,人工智能,数据预处理,分类分析,社会经济研究 数据概述: 本数据集源自1994年美国人口普查局数据库,由Ronny Kohavi和Barry...
    packageimg
  • Tox21药物毒性预测化学化合物数据集-2021

    2025年4月15日   

    Tox21药物毒性预测化学化合物数据集-2021 数据来源:互联网公开数据 标签:Tox21,药物毒性,化学化合物,机器学习,预测,毒理学实验,数据集,科研,教育 数据概述:...
    packageimg
  • 美国二手书市场数据集

    2025年4月15日   

    美国二手书市场数据集 数据来源:互联网公开数据 标签:二手书,市场分析,数据清洗,数据转换,数据分析,价格趋势,作者分布,编辑分布,类别分析 数据概述:...
    packageimg
  • 纽约市Airbnb房源数据清洗版数据集

    2025年4月15日   

    纽约市Airbnb房源数据清洗版数据集 数据来源:互联网公开数据 标签:Airbnb,纽约市,房源,租赁,数据清洗,数据可视化,价格,地理位置,评论,住宿 数据概述: 本数据集是纽约市Airbnb开放数据的清洗版本,源数据来自Kaggle网站上的公开数据集。原始数据集由Arian...
    packageimg
  • Trendyol智能手机数据集

    2025年4月15日   

    Trendyol智能手机数据集 数据来源:互联网公开数据 标签:Trendyol,智能手机,产品信息,机器学习,数据可视化,价格预测,市场分析 数据概述: 本数据集包含19个字段和939条记录,数据来源于Trendyol.com,使用Python-...
    packageimg
  • 宾夕法尼亚大学语料库初步版本数据集

    2025年4月15日   

    宾夕法尼亚大学语料库初步版本数据集 数据来源:互联网公开数据 标签:宾夕法尼亚大学,语料库,自然语言处理,文本分析,语言学 数据概述: 本数据集是宾夕法尼亚大学语料库的初步版本,涵盖了一系列标注的英语文本,适用于自然语言处理和语言学研究。该语料库包含了精心标注的句子结构、词性、依存关系等信息,为研究人员提供了丰富的语言学数据资源。 数据用途概述:...
    packageimg
  • 脏财务交易数据集

    2025年4月15日   

    脏财务交易数据集 数据来源:互联网公开数据 标签:财务交易,数据清洗,数据预处理,数据质量,缺失值,无效数据,重复数据,异常值 数据概述:...
    packageimg