数据简介:
该数据集包含加利福尼亚州多个区域的住房统计信息,数据源主要用于分析房价与住房相关因素之间的关系。数据被分为训练集和测试集两个部分,适用于机器学习建模、房地产市场分析及城市规划研究等场景。
字段定义:
longitude:经度,表示每条记录所对应地块的地理经度
latitude:纬度,表示每条记录所对应地块的地理纬度
housing_median_age:房屋中位年龄,单位为年
total_rooms:总房间数,包括卧室、起居室等
total_bedrooms:总卧室数
population:对应区域内居住人口数量
households:家庭户数量,指的是独立居住的住户单位
median_income:家庭年收入中位数,单位为万美元
median_house_value:房屋价值中位数,单位为美元
数据格式:
CSV(逗号分隔值)格式,含标题行,数值型字段保留小数
时间范围:
未明确标注具体时间范围,通常视为数据收集时点的静态快照
地理范围:
美国加利福尼亚州全境,包含多个城市与县级区域