西班牙房地产地理参考数据集

西班牙房地产地理参考数据集 数据来源:互联网公开数据
标签:房地产,西班牙,地理参考,城市中心,交通距离,房屋属性,价格分析,城市研究

数据概述
本数据集提供了西班牙主要城市(马德里、巴塞罗那、瓦伦西亚)的房地产详细信息,包含超过180,000条经过匿名化的房产记录。数据集覆盖了每处房产的地理位置、属性特征、价格信息以及与关键城市设施的相对距离,如城市中心、地铁站和主干道等。数据字段包括但不限于房产标识、面积、房间数量、配套设施(如露台、电梯、泳池等)、建筑年份、楼层信息、地理位置(经纬度)以及与城市关键区域的距离等。数据集基于2018年的原始记录,以CSV格式呈现,保留了大部分地理特征,适合用于房地产分析和城市规划研究。

数据用途概述
该数据集适用于多种应用场景,包括:
1. 房地产市场分析:研究人员可以利用数据集中的价格、面积、配套设施等信息,分析西班牙主要城市的房地产市场趋势,评估不同区域的房价水平和供需关系。
2. 城市规划与研究:通过房产与城市中心、地铁站、主干道等关键设施的距离信息,可以研究城市空间布局对房地产价值的影响,支持城市规划决策。
3. 投资决策支持:房地产投资者可以使用数据集识别具有投资潜力的区域和房产类型,结合地理位置和配套设施评估投资回报。
4. 学术研究:数据集为城市地理学、房地产经济学、城市规划等相关领域的研究提供了丰富的实证材料,支持对西班牙城市空间结构和房地产市场动态的深入分析。
5. 政策制定:政策制定者可以基于数据集评估住房政策的效果,如租房补贴、城市更新计划等对房地产市场的影响。

数据字段说明
以下是数据集中关键字段的简要说明:
- ASSETID:每个房产的唯一标识符,用于区分数据集中的不同房产记录。
- PERIOD:数据记录的时间周期,以YYYYMM格式表示年份和月份。
- PRICE:房产的总价格,以当地货币单位表示。
- UNITPRICE:每平方米的价格,用于评估房产的单位面积价值。
- CONSTRUCTEDAREA:房产的总面积(平方米),反映房产规模。
- ROOMNUMBER:房产的房间总数,包括卧室、客厅等。
- BATHNUMBER:房产的卫生间数量。
- HASTERRACE, HASLIFT, HASAIRCONDITIONING:分别表示房产是否拥有露台、电梯和空调的二元指示变量(0或1)。
- HASPARKINGSPACE, ISPAKKINGSPACEINCLUDEDINPRICE, PARKINGSPACEPRICE:与停车位相关的字段,包括是否提供停车位、停车位是否包含在房价中,以及停车位的价格信息。
- HASNORTHORIENTATION, HASSOUTHORIENTATION, HASEASTORIENTATION, HASWESTORIENTATION:分别表示房产是否朝向北、南、东、西的二元指示变量。
- HASBOXROOM, HASWARDROBE, HASSWIMMINGPOOL, HASDOORMAN, HASGARDEN:分别表示房产是否包含储物间、内置衣柜、泳池、门卫服务和花园的二元指示变量。
- ISDUPLEX, ISSTUDIO, ISINTOPFLOOR:分别表示房产是否为复式公寓、单身公寓或位于顶层的二元指示变量。
- CONSTRUCTIONYEAR, FLOORCLEAN, CADCONSTRUCTIONYEAR, CADMAXBUILDINGFLOOR, CADDWELLINGCOUNT, CADASTRALQUALITYID:反映房产建筑年份、楼层信息、土地注册信息(如建筑年份、建筑层数、单元数、质量等级)的字段。
- BUILTTYPEID_1, BUILTTYPEID_2, BUILTTYPEID_3:分别表示房产是否为新建筑、待翻新二手房或良好条件二手房的二元指示变量。
- DISTANCE_TO_CITY_CENTER, DISTANCE_TO_METRO, DISTANCE_TO_{main avenue}:反映房产与城市中心、地铁站和主干道距离的数值字段,单位为公里。
- LONGITUDE, LATITUDE:房产的地理坐标,分别表示经度和纬度。

数据特点
- 数据集以CSV格式提供,保留了大部分地理特征,但丢失了原始的几何点列(如GeoJSON格式)。
- 数据字段全面,涵盖房产的基本属性、配套设施、地理位置和城市关键设施的距离信息。
- 数据基于2018年的原始记录,经过匿名化处理以保护隐私。

数据来源与引用
该数据集基于Antonio Paez等人在GitHub上发布的“idealista18”项目(https://github.com/paezha/idealista18),并经过改编以CSV格式发布。原始数据的详细信息和方法论可参考Antonio Paez的GitHub页面以及相关学术论文:
- Rey-Blanco, D., Arbues, P., Lopez, F., & Paez, A. (2024). A geo-referenced micro-data set of real estate listings for Spain’s three largest cities. Environment and Planning B: Urban Analytics and City Science, 51(6), 1369-1379. https://doi.org/10.1177/23998083241242844
- Idealista Labs博客文章:https://www.idealista.com/labs/blog/?p=4207

注意事项
- 部分字段(如AMENITYID)的具体含义可能需要参考额外文档,建议在使用前确认其定义。
- 数据中的地理位置信息经过匿名化处理,但仍然可以用于城市尺度的分析。
- 数据集中的缺失值(如CONSTRUCTIONYEAR中的NA)应在分析时予以注意。

通过上述内容,数据使用者可以快速了解数据集的组成和价值,为后续的研究和应用提供基础支持。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 15, 2025, 23:13 (UTC)
创建于 四月 15, 2025, 23:12 (UTC)