Bootstrap

深圳市蛋壳公寓租房数据分析

在这里插入图片描述

前言

2020年以来,受疫情冲击、政策监管收紧等多重因素影响,长租公寓可谓路途坎坷。根据中国房地产报不完全统计,今年最近几个月时间里,暴雷的长租公寓累计达到20多家,数十万租客受到影响。

蛋壳公寓,凭借着长租公寓风口,用5年时间,做到了分散式长租公寓第二,仅次于自如。于2020年1月17日在纽约证券交易所正式挂牌上市,成为2020年登陆纽交所的中国第一股。然而,风口退去,加之突如其来的疫情,于近日暴雷,已有很多文章对蛋壳公寓的商业模式、租金贷、管理方式等进行了深入分析。

本文仅从数据角度出发,爬取了蛋壳公寓深圳区域所有在租公寓信息,清洗数据,并进行可视化分析,为大家了解蛋壳公寓提供一个新的视角。菜J学Python公众号后台回复「蛋壳」可获取本文完整代码和数据集。

可视化分析

区域分布

在这里插入图片描述
通过深圳市蛋壳公寓分布地图,我们可以很直观的看出蛋壳公寓主要分布在深圳的发展中心以及轴线上,前海中心与福田罗湖中心的公寓租金价格明显高于其他区域。轴线基于便捷的轨道交通串联,周边配套较为齐全,满足了广大年轻白领的租赁需求。
在这里插入图片描述
具体从行政区分布来看,龙岗区虽然整体公寓租金相对更低,但公寓数量高于福田和南山区。蛋壳公寓的分布与贝壳找房较为类似,但贝壳在租房源数量远高于蛋壳。
在这里插入图片描述
从小区分布来看,位于龙岗区的锦荟PARK在租公寓最多,共有83个房源。
在这里插入图片描述
锦荟PARK周边配套齐全,地铁上盖,靠近大生体育公园,1公里产业配套有金辉工业园、志华工业园、中和盛世珠宝文化创意创新产业园等,对劳动力具有一定吸引力。同时还有医院、文体广场等,可以满足都市白领生活一站式服务需求。
在这里插入图片描述

租金分布

深圳蛋壳公寓平均租金为1911元/月,第一、第二、第三四分位数分别为1530,1870,2192,说明房租还是比较集中的。
在这里插入图片描述
对深圳蛋壳公寓租金进行分段,我们发现公寓的价格主要集中在1000-2000元/月之间,共计2995个,占比59.71%。其次是2000-3000元/月,数量为1798,占比35.84%。
在这里插入图片描述

面积分布

深圳蛋壳公寓面积集中在10㎡以下和10-20㎡,10-20㎡的公寓共有2415个,占比达48.14%,10㎡以下的公寓也不少,数量为2206个,占比43.98%。
在这里插入图片描述

户型分布

深圳蛋壳公寓在租的房屋户型大部分为4室1卫,占比高达58.64%,其次是5室1卫,占比18.72%。
在这里插入图片描述

楼层分布

从深圳蛋壳公寓所在楼层分布来看,其南山区和福田区的公寓所在楼层相对更高。
在这里插入图片描述
大多数的公寓分布在10层以下,占比58.59%,40层以上的公寓仅有 42个,占比0.84%。
在这里插入图片描述

周边地铁

深圳蛋壳公寓普遍距离地铁较近,平均距离为592米,距离地铁最远的公寓也不到2公里,完全可以步行解决轨道出行问题。
在这里插入图片描述

相关性分析

从相关系数表可以看出,深圳蛋壳公寓的面积、周边地铁数对公寓的价格有较大的的影响,相关系数分别为0.54和0.22。蛋壳公寓在进行房屋定价时,对公寓的面积以及公寓的地铁配套有较大权重的考虑。由于深圳蛋壳所有的公寓距离地铁都不到2公里,距离的远近对公寓的价格影响有限。另外,所在楼层也不是蛋壳主要考虑的定价因素。
在这里插入图片描述

技术实现

数据来源

蛋壳公寓网页结构相对简单,数据结构统一,简单的url翻页构造即可。本文用request请求到数据,用xpath对返回的数据进行解析,最后以追加模式将数据存储为csv文件。爬虫核心代码如下:

def get_danke(href):
    time.sleep(random.uniform(0, 1))  #设置延时,避免对服务器产生压力
    response = requests.get(url=href, headers=headers)
    if response.status_code == 200:  #部分网页会跳转404,需要做判断
        res = response.content.decode('utf-8')
        div = etree.HTML(res)
        items = div.xpath("/html/body/div[3]/div[1]/div[2]/div[2]")
        for item in items:
            house_price=item.xpath("./div[3]/div[2]/div/span/div/text()")[0]
            house_area=item.xpath("./div[4]/div[1]/div[1]/label/text()")[0].replace('建筑面积:约','').replace('㎡(以现场勘察为准)','')
            house_id=item.xpath("./div[4]/div[1]/div[2]/label/text()")[0].replace('编号:','')
            house_type=item.xpath("./div[4]/div[1]/div[3]/label/text()")[0].replace('\n',''
;