巴基斯坦二手车市场PakWheels车辆信息数据集-6万条记录
数据来源:互联网公开数据
标签:汽车,二手车,价格预测,数据清洗,探索性数据分析,机器学习,巴基斯坦,车辆信息,PakWheels
数据概述:
本数据集收录了PakWheels网站上发布的二手车信息,PakWheels是巴基斯坦最大的汽车交易平台之一。数据集包含约6万条记录,涵盖了车辆的各项关键属性,包括品牌、型号、生产年份、行驶里程、发动机排量以及售价等。
数据用途概述:
该数据集可应用于多个领域,包括但不限于:
汽车价格预测:构建机器学习模型,基于车辆的生产年份、行驶里程、发动机排量和所在城市等因素预测车辆价格。
数据清洗与处理:进行数据清洗和转换练习,例如,将价格列从字符串格式(如“PKR 71 lacs”)转换为数值型,以便进行建模。
探索性数据分析(EDA):进行深入的数据分析,探索价格随城市、品牌或年份的变化趋势。
特征工程:创建新的特征,如“车龄”(当前年份-生产年份),以丰富数据集,提升模型表现。
字段说明:
title:车辆完整标题,包含品牌、型号和年份(例如,“KIA Sportage 2021 AWD出售”)。
city:车辆出售所在城市(例如,“伊斯兰堡”、“拉合尔”)。
model:车辆生产年份(例如,“2021”、“2010”)。
running:车辆行驶里程,单位为公里(例如,“73,000公里”)。
CC:发动机排量,单位为立方厘米,或电动汽车的电池容量(例如,“2000 cc”,“100.0 kWh”)。
Transmission:车辆的变速箱类型,自动或手动。
price:车辆的标价,包含货币单位(例如,“PKR 71 lacs”)。