找到1,259个数据集

标签: 数据清洗

过滤结果
  • 印度选举详细结果数据集

    2025年4月14日   

    印度选举详细结果数据集 数据来源:互联网公开数据 标签:选举结果,印度,政治分析,时间序列,选区分析,数据清洗,政府统计 数据概述:...
    packageimg
  • 意大利票房数据集

    2025年4月14日   

    意大利票房数据集 数据来源:互联网公开数据 标签:意大利票房,电影产业,数据分析,市场趋势,娱乐产业,电影票房,数据清洗 数据概述: 本数据集包含了意大利自Cinetel网站公开上传的票房数据,数据涵盖范围截至每日更新。原始数据经过Python和Pandas进行清洗,数据集中同时提供了原始未清洗数据和清洗后的数据,分别存储在两个不同的CSV文件中。...
    packageimg
  • 澳大利亚汽车价格原始数据集

    2025年4月14日   

    澳大利亚汽车价格原始数据集 数据来源:互联网公开数据 标签:汽车价格,澳大利亚,原始数据,数据清洗,数据预处理,汽车市场分析 数据概述: 本数据集包含了从"https://www.ccarprice.com/au/"网站抓取的2683辆汽车的原始信息。数据未经过任何清洗和预处理,适合用于实践数据清洗和预处理技巧。 数据用途概述:...
    packageimg
  • 美国航空评论数据集

    2025年4月14日   

    美国航空评论数据集 数据来源:互联网公开数据 标签:美国航空,客户评论,数据清洗,数据分析,情感分析,客户流失分析,机器学习,Python 数据概述: 本数据集通过网络抓取自一家航空评论网站,包含超过3800条美国航空的客户评论。数据集仅有一列,即评论文本,其中包含可能需要清理的文本信息。这些评论数据为进行各种分析提供了丰富的材料。 数据用途概述:...
    packageimg
  • 房屋价格数据集-经过清洗

    2025年4月14日   

    房屋价格数据集-经过清洗 数据来源:互联网公开数据 标签:房屋价格,房地产,数据分析,数据清洗,特征缩放,时间序列,市场趋势 数据概述:...
    packageimg
  • 金融新闻情感数据集

    2025年4月14日   

    金融新闻情感数据集 数据来源:互联网公开数据 标签:金融新闻,情感分析,NLP,文本处理,数据清洗,股票市场 数据概述: 本数据集包含标注了情感标签的金融新闻文本,适用于自然语言处理(NLP)任务。数据集经过了一系列文本处理操作,包括去除空值、删除重复项、平衡各类情感标签的数量、去除前后空格和换行符、移除URL、展开缩写(如将“it's”转换为“it...
    packageimg
  • 猎鹰9号火箭2010年至今发射任务数据集

    2025年4月14日   

    猎鹰9号火箭2010年至今发射任务数据集 数据来源:互联网公开数据 标签:猎鹰9号,火箭发射,SpaceX,太空探索,发射任务,时间序列,维基百科,Web Scraping,数据清洗 数据概述: 本数据集包含了自2010年至今SpaceX公司猎鹰9号火箭的发射任务相关数据。数据来源于维基百科,通过Web...
    packageimg
  • 银行客户流失预测数据分析集

    2025年4月14日   

    银行客户流失预测数据分析集 数据来源:互联网公开数据 标签:客户流失,银行,预测模型,客户特征,数据清洗,特征工程,分类技术 数据概述:...
    packageimg
  • 足球表现数据集

    2025年4月14日   

    足球表现数据集 数据来源:互联网公开数据 标签:足球,运动员表现,睡眠质量,肌肉酸痛,压力,运动科学,数据清洗,训练日常 数据概述:...
    packageimg
  • 意大利2021年12月1日汽油价格地理空间数据集

    2025年4月14日   

    意大利2021年12月1日汽油价格地理空间数据集 数据来源:互联网公开数据 标签:汽油价格,意大利,地理空间分析,汽车燃料,油价趋势,数据清洗,交通基础设施 数据概述: 本数据集收录了2021年12月1日在意大利所有加油站的各类汽车燃料价格记录,包括汽油、柴油、甲烷、丙烷-...
    packageimg
  • 数据准备编码数据集

    2025年4月14日   

    数据准备编码数据集 数据来源:互联网公开数据 标签:数据准备,编码,数据清洗,数据预处理,机器学习,人工智能 数据概述: 本数据集提供了经过初步处理、适合进一步编码的数据。数据已经进行了基本的清洗和预处理,包括处理缺失值、异常值以及数据格式的统一,旨在为后续的编码和分析提供一个良好的起点。 数据用途概述:...
    packageimg
  • 动漫详情与分类分析数据集

    2025年4月14日   

    动漫详情与分类分析数据集 数据来源:互联网公开数据 标签:动漫,分类,推荐系统,行业分析,数据清洗,数据整合 数据概述: 本数据集整合了来自MyAnimeList(MAL)和Jikan API的动漫相关信息,包含动漫详情、分类标签及其关联信息。数据集分为四个部分: 1. manga.csv - 包含动漫的基本信息,如标题、类型、评分、上映时间等。 2....
    packageimg
  • 电影推荐系统构建数据集-电影信息与用户互动数据-时间跨度不限

    2025年4月14日   

    电影推荐系统构建数据集-电影信息与用户互动数据-时间跨度不限 数据来源:互联网公开数据 标签:电影,推荐系统,数据清洗,EDA,特征工程,机器学习,用户行为,电影信息,流行度分析,电影评论 数据概述:...
    packageimg
  • 犬种图像及特征数据集

    2025年4月14日   

    犬种图像及特征数据集 数据来源:互联网公开数据 标签:犬种,图像数据,动物特征,性别,毛发,寿命,数据清洗 数据概述: 本数据集包含超过1000只不同犬种及其特征信息的图像资料,并以CSV、XLSX和JSON三种格式提供。数据涵盖了犬种、毛发类型(短毛或长毛)、毛发颜色、性别、图像URL及预期寿命等关键要素,为研究犬种特征和图像分析提供了丰富的资源。...
    packageimg
  • 英国房价预测数据集

    2025年4月14日   

    英国房价预测数据集 数据来源:互联网公开数据 标签:房价预测,机器学习,英国房地产,数据清洗,监督学习,时间序列,房地产分析 数据概述: 本数据集基于英国政府公开的Price Paid...
    packageimg
  • 印度房地产价格线性回归预测数据集1963-2021

    2025年4月14日   

    印度房地产价格线性回归预测数据集1963-2021 数据来源:互联网公开数据 标签:房地产,印度,房价预测,线性回归,数据清洗,误差分析,模型评估 数据概述:...
    packageimg
  • Goodreads书籍样本数据清洗与整理数据集

    2025年4月14日   

    Goodreads书籍样本数据清洗与整理数据集 数据来源:互联网公开数据 标签:书籍,Goodreads,数据清洗,文本分析,图书推荐,Python,数据整理 数据概述:...
    packageimg
  • 贷款申请回归分析数据集

    2025年4月14日   

    贷款申请回归分析数据集 数据来源:互联网公开数据 标签:贷款申请,回归分析,数据清洗,数据编码,金融分析,信用评估 数据概述: 本数据集包含已经处理、清理和编码的贷款申请数据,适用于直接输入回归模型进行分析,无需额外的数据预处理工作。数据集涵盖了多个贷款申请的关键特征,如借款人信息、贷款金额、还款历史等,为金融分析和信用评估提供了高质量的数据支持。...
    packageimg
  • 互联网公开数据集多源数据分类与分析

    2025年4月8日   

    标题:互联网公开数据集多源数据分类与分析 数据内容: 该数据集包含来自互联网公开数据的多源数据元素,主要涉及文件名(filename)和标签(label)两个核心字段。其中,文件名字段包含12600种不同的值,标签字段包含15种不同的分类值。数据内容涵盖了多种数据类型和应用场景,适用于需要对多源数据进行分类、分析和挖掘的任务。 数据来源:...
    packageimg