美国房屋宜居性预测机器学习竞赛数据集
数据来源:互联网公开数据
标签:机器学习,房屋,宜居性,预测,美国,HackerEarth,竞赛,房地产,数据分析
数据概述:
本数据集是HackerEarth平台举办的“Get a Room ML Hackathon”竞赛所使用的数据集,旨在通过机器学习模型预测美国房屋的宜居性评分。 数据集包含训练集(train.csv)、测试集(test.csv)和提交样例文件(sample_submission.csv)。 训练集和测试集分别包含39496条和10500条房屋信息,用于模型的训练和评估。
数据字段描述:
*   Property_ID:房屋的唯一标识
*   Property_Type:房屋类型(公寓、平房等)
*   Property_Area:房屋面积(平方英尺)
*   Number_of_Windows:窗户数量
*   Number_of_Doors:门的数量
*   Furnishing:房屋装修情况(全装修、半装修、未装修)
*   Frequency_of_Powercuts:每周平均停电次数
*   Power_Backup:是否有备用电源
*   Water_Supply:供水情况(全天候、每天一次-上午、每天一次-下午、每两天一次)
*   Traffic_Density_Score:交通拥堵程度评分(1-10)
*   Crime_Rate:社区犯罪率(远低于平均水平、略低于平均水平、略高于平均水平、远高于平均水平)
*   Dust_and_Noise:社区的粉尘和噪音程度(高、中、低)
*   Air_Quality_Index:社区空气质量指数
*   Neighborhood_Review:居民对社区的平均评分
*   Habitability_score:房屋宜居性评分(目标变量,仅在训练集中)
数据用途概述:
该数据集主要用于机器学习模型的训练和评估,目标是预测房屋的宜居性评分。 开发者可以使用该数据集进行特征工程、模型选择、参数调优等,构建预测模型。 此外,该数据集也可用于探索性数据分析,以了解不同因素对房屋宜居性的影响,为房地产市场分析和个人住房选择提供参考。