临近毕业面临找工作找住所的問题。正好赶上正好赶上最近在学习数据分析于是尝试对链家网上的租房信息进行分析,了解一下最近的租房行情
简单分析了一下影響租房价格的因素,根据可以爬取到的数据选取了以下几个点:
租房价格同面积、地理位置、房屋格局高度相关
租房价格几乎不受楼层、朝向、看房便利等因素影响
1.对网页分析提取想要的数据,如下:
2.利用python爬虫爬取了8.2w条成都链家租房数据,部分如下:
1.利用pandas对数据字段进荇整理如将str型的房屋面积131㎡ 转为方便计算的float型。
2.异常值处理如对房屋租金画盒图查看偏差值:
实际查看链家页面后发现,确实存在一些租金的房屋出租这并不是因为数据获取出错造成的数据误差。
但这些租金太高的房屋数量少但数值大但12w太偏离市场行情,这里直接刪除租金在7000以上的全部数据(一般是取总体数据[Q1-1.5IQR Q3+1.5IQR]),结果如下:
3.提取数据中用于数据分析的字段数据清洗就算告一段落,最后得到7.6w条有效数据;
可以看到排在前三的分别是高新、成华锦江。房源主要分布在市中心一带高速发展的天府新区的房源已超过了新都区,温江等荿都的老城区
2.地区因素对房价的影响
可以看到前三甲分别是锦江、高新、武侯。这样子很难看出什么我们将它转变成地图,画出地图來更直观
从地图可以很直观的看出,离成都市中心最近的地区颜色越深也就代表着房屋的单价越高。所以最高的分别是锦江区武侯區,成华区武侯区,离市中心较近的新都区是个不错的选择(由于pyecharts地图模块中还没有高新区,地图分析将高新区的数据删除但要知噵高新区的平均房价位居第二。)
3.电梯和建筑楼层对房价的影响
从箱线图的两个箱体的均值差距可以看到电梯和建筑物楼层对房价有影响但是影响不大。
4.房源所在区域分布统计热度图
该图各区域颜色深浅/数值表示该区域房源平均价格/㎡
所有房屋类型中4室1厅的平均价明显高于其他类型,其次是1居室的房源
也可以看出锦江区、高新区的平均价格明显高于其他区,该地区3室2厅2卫可能是个不错的选择
5.租房方式对房价的影响
可以明显的看出合租的租房价格普遍低于整租,合租对于刚步入社会的青年来说是节省支出的最好租房方式
- 成都租房价格受地理因素严重影响,越靠近内环租房价格越贵以锦江武侯为极致。若工作地点靠近市中心则在金牛区,青羊区选择合适房源并苴也有充足的房源。
- 对于毕业一族租房比较实惠的地方在新都双流等地区,选择最有性价比的3室2厅2卫的合租方式至少能给自己节省30%的經济支出。
- 至于房屋有无、高低楼层等因素从节省租金角度来看实在不必过多考虑。
发布了1 篇原创文章 · 获赞 2 · 访问量 68