国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

用數(shù)據(jù)說話:北京房價數(shù)據(jù)背后的數(shù)據(jù)

大數(shù)據(jù)
從2014年對樓市的普遍唱衰,到2015年的價格回暖,到底發(fā)生了怎樣的改變?本文就嘗試通過大數(shù)據(jù)來和豐富的圖表,為大家展現(xiàn)數(shù)據(jù)背后的數(shù)據(jù)。

從2014年對樓市的普遍唱衰,到2015年的價格回暖,到底發(fā)生了怎樣的改變?本文就嘗試通過大數(shù)據(jù)來和豐富的圖表,為大家展現(xiàn)數(shù)據(jù)背后的數(shù)據(jù)。

  • 數(shù)據(jù)采集采用筆者用C#開發(fā)的爬蟲工具。
  • 數(shù)據(jù)清洗ETL采用了筆者開發(fā)的工具軟件。
  • 數(shù)據(jù)分析采用ipython notebook和pandas
  • 可視化使用了matplotlib和seaborn.
  • 熱力圖使用了百度地圖API, 按經(jīng)緯度0.01度為一個子區(qū)域,計算其中的平均值作為當(dāng)前區(qū)域的房價/二手房數(shù)量。

至于搭建ipython notebook和安裝相應(yīng)類庫的操作,以及各個類庫使用方法,可參考相應(yīng)的教程。

數(shù)據(jù)來源

這些數(shù)據(jù)是筆者在2014年10月年和2015年10月份兩次,在鏈家官網(wǎng)上抓取的在售二手房數(shù)據(jù),2014年約為64000條,2015年總計約7W條。數(shù)據(jù)源可能會有偏差,因此結(jié)論僅供參考。附件有前1W條樣例數(shù)據(jù),可供下載。

首先我們導(dǎo)入所需的類庫:

  1. # -*- coding:utf-8 -*- 
  2. import mongo; 
  3. import pandas as pd; 
  4. import csv; 
  5. from pandas import DataFrame,Series 
  6. 之后加載所需的數(shù)據(jù): 
  7.  
  8. table2014 = pd.read_table("LJ2014.txt",encoding='utf-8',engine='python',quoting=csv.QUOTE_NONE) 
  9. table2015 = pd.read_table("LJ2015.txt",encoding='utf-8',engine='python',quoting=csv.QUOTE_NONE) 
  10. table2014[u'小區(qū)名']=table2014[u'小區(qū)名'].map(lambda x:unicode(x).strip("'")) 
  11. table2014[u'區(qū)縣']=table2014[u'區(qū)縣'].map(lambda x:unicode(x).strip("'")) 
  12. table2014[u'樓名']=table2014[u'樓名'].map(lambda x:unicode(x).strip("'")) 
  13. yeartable2014[u'年份'].map(lambda x:str(x).split('/')[0]) 
  14. table2014[u'小區(qū)']=table2014[u'位置'].map(lambda x:unicode(x).strip("'")) 
# -*- coding:utf-8 -*- import mongo; import pandas as pd; import csv; from pandas import DataFrame,Series

之后加載所需的數(shù)據(jù):

table2014 = pd.read_table("LJ2014.txt",encoding='utf-8',engine='python',quoting=csv.QUOTE_NONE)
table2015 = pd.read_table("LJ2015.txt",encoding='utf-8',engine='python',quoting=csv.QUOTE_NONE)
table2014[u'小區(qū)名']=table2014[u'小區(qū)名'].map(lambda x:unicode(x).strip("'"))
table2014[u'區(qū)縣']=table2014[u'區(qū)縣'].map(lambda x:unicode(x).strip("'"))
table2014[u'樓名']=table2014[u'樓名'].map(lambda x:unicode(x).strip("'"))
year= table2014[u'年份'].map(lambda x:str(x).split('/')[0])
table2014[u'小區(qū)']=table2014[u'位置'].map(lambda x:unicode(x).strip("'"))

瘋長的房價

從1992年到2015年,北京的房價經(jīng)歷了怎樣的瘋狂?可以查看下面的圖表。

可以看到,1992年到2002年,呈現(xiàn)一個非常穩(wěn)定的狀態(tài)。從2008年起,北京的房價如同火箭一般上竄。

有意思的是,如果按照建造時間來繪制圖表,會發(fā)現(xiàn)在2000年和2004年左右,達(dá)到高峰。在6W套二手房中,2000年總共建造了7697套,占比百分之11.21%。

 
  1. xcqu2014=table2014.groupby(by=u'位置'
  2. p=year.value_counts(); 
  3. pp=p.sort_index()[50:-1] 
  4. p.plot(title=u'北京各年建造房屋數(shù)量變化'

到了2014年,北京各個區(qū)縣的二手房價格如下圖:

  1. areag=table2014.groupby(by=u'區(qū)縣'
  2. areag[u'價格'].mean().order(ascending=True).plot(kind='barh',title=u'各城區(qū)的二手房平均房價'

西城區(qū)和東城區(qū)的平均價格在五萬五左右,之所以沒有達(dá)到網(wǎng)上其他數(shù)據(jù)所提到的喪心病狂的9萬,是因為我們分析的是二手房。目前二環(huán)內(nèi)新樓盤的數(shù)量極少,幾乎沒有討論的價值。

我們將房價以熱力圖方式繪制在地圖上,就會非常直觀:

顏色越深,代表其價格越高。除了西城,東城這些老城區(qū),中關(guān)村(包含大量的學(xué)區(qū)房)和國貿(mào)(北京CBD)都價格高企。

[[154790]]

如果我們改變縮放等級,進(jìn)一步縮小地圖范圍,可以看到最貴的房子,集中在西單,南鑼鼓巷,國貿(mào),以及北新橋地區(qū)。

這些最貴小區(qū)的房價有多貴呢?下面列出排名前十的十個小區(qū)的價格:

xcqu2014[u'價格'].mean().order(ascending=False)[1:10].plot(kind='barh',title=u'價格最高的十個小區(qū)的平均房價')

文華胡同的位置在哪里呢?筆者專門去搜索了一下。這個超牛無比,價格在33萬/平的文華胡同在靠近鬧市口大街的西單商圈。

更夸張的是,兩套房子都是平房,面積分別是12平和15平,其中一套還是1949年建的。中介給出的宣傳標(biāo)語是,最牛實驗二小學(xué)區(qū)房,搶搶搶!這么小的面積,估計是四合院的廂房改造的吧。現(xiàn)在官網(wǎng)上已經(jīng)下架。

什么樣的房子最多?

我們先看,什么類型的樓房最多,下面給出了樓房總體高度的比例。可以看到,二手房中,六層是最多的。國家規(guī)定,七層就要裝電梯了。因此在2000年以前,大部分的居民樓都是6層。

lc=lc=table2014.groupby(by=u'樓層').size();
lc.order(ascending=False)[:20].plot(kind='barh',title=u'樓高比例')

再看看不同面積的房子所占總數(shù)的比例。我們?nèi)∶娣e為40-140平米的房子,進(jìn)行了統(tǒng)計分析,結(jié)論如下圖:

size=table2014.groupby(by=u'面積').size();
import re;
takenum= re.compile('\d+');
size=size[size.index.map(lambda x:takenum.match(x) is not None)]
size.index=size.index.map(lambda x:int(x))
size.order(ascending=False)[:100].sort_index().plot(kind='line',title=u'房型面積和對應(yīng)比例')

首先選出面積值不為空且為數(shù)字的所有行,之后將其轉(zhuǎn)換為int類型,后對其進(jìn)行排序并繪圖。

可見,60平的一室一廳或兩室一廳最為常見。90平米的三居和兩居也較多。

我們再對二手房存量繪制熱力圖:

可以看到,二手房主要集中在天通苑,北苑,望京,十里堡和通州。這基本上與北京2004年發(fā)布的《北京市城市總體規(guī)劃2004-2020》的內(nèi)容相符:

很有意思的是,綠色的區(qū)域相當(dāng)空曠,比如筆者目前所在的三元橋地區(qū),和酒仙橋之間隔了好大一片荒地,晚上夜跑時荒無人煙。

2014年到2015年的房價變化

下面是剛需讀者最關(guān)心的內(nèi)容,2014年到2015年的北京房價,經(jīng)歷了怎樣的變化?眾所周知,2014年房價走低,整體唱衰,甚至有商家打出了降價6000元/平的廣告來推銷房子。2015年,降準(zhǔn)降息政策出爐,公積金貸款比例提高,北京房價回暖,我們知道肯定漲價了。但到底漲了多少呢?

這部分的代碼多一些,選取價格少于10萬,面積大于四十平米的房子,以減少錯誤的數(shù)據(jù)。求出2014年和2015年小區(qū)的交集,構(gòu)造change結(jié)構(gòu),里面保存了每個小區(qū)的房子數(shù)量,2014年和2015年的平均價格。


  1. table2014table2014= table2014[(table2014[u'價格']<100000) & (table2014[u'面積']>40)] 
  2. table2015table2015= table2015[(table2015[u'單價']<100000) & (table2015[u'面積']>40)] 
  3. xcqu2014=table2014.groupby(by=u'位置'
  4.  
  5. table2015[u'面積']= np.round(table2015[u'總價']*10000/table2015[u'單價']) 
  6.  
  7. xcqu2015=table2015.groupby(by=u'小區(qū)'
  8. p2015=xcqu2015.mean()[u'單價'] 
  9. p2014=xcqu2014.mean()[u'價格'] 
  10. xcqumonunt2014=xcqu2014.size() 
  11.  
  12. xcqumerge=p2014.index&p2015.index 
  13. changeDataFrame({'2014': p2014[xcqumerge].values,'2015':p2015[xcqumerge].values,'mount2014':xcqumonunt2014[xcqumerge],'mount2015':xcqumonunt2015[xcqumerge]}) 
  14.  
  15. change['diff']=change['2015']-change['2014'] 
  16. change['percent']= np.round( change['diff']/change['2014']*100.0) 

我們按照2014和2015年價格增減的百分比,繪制出下面的房價變化數(shù)量比例圖。可以看到,房價變化基本呈現(xiàn)正態(tài)分布趨勢。但均值不在0點,靠近5%左右,整體右移:


  1. change[(change.percent>-30) & (change.percent<50)].groupby(by='percent').size().plot(title=u'不同漲跌幅度房子所占的數(shù)量'

經(jīng)過統(tǒng)計,2014年的平均房價為40125/平,2015年為42535/平。漲價比例5.64%。也就是說,一套三百萬的房子,平均漲了16萬左右。


  1. change[(change.percent>-30) & (change.percent<50)].mean(by='percent'
  2.  
  3. 2014         40054.083797 
  4. 2015         42400.225776 
  5. mount2014       15.352119 
  6. mount2015       13.466281 
  7. diff          2346.141979 
  8. percent          5.508430 

我們列出10萬元以下單價,2015年小區(qū)內(nèi)二手房數(shù)量超過20套的漲價排名前十的小區(qū):


  1. change[change.mount2015>20].sort(columns='percent',ascending=False)[:10] 

上地房價怎么漲了這么多?即使在北京,7萬8的價格都已經(jīng)是豪宅,可是上地的房子,一般都是普通的住宅。

原因還是學(xué)區(qū)房,海淀區(qū)教改使得這邊的房子變化極大。 上地東里小區(qū)內(nèi)建有上地實驗小學(xué),該小學(xué)可直升一零一中學(xué)上地分校,一零一中學(xué)上地分校位于上地西里北側(cè),就是這9年直升的誘惑導(dǎo)致該區(qū)域房價直線攀升。可憐天下父母心!

當(dāng)然,有漲價就有降價:基本上,降價的小區(qū)都在非中心城區(qū),例如櫻花園就在順義。


  1. change[change.mount2015>20].sort(columns='percent',ascending=True)[:10] 

結(jié)論

5%的漲幅,已經(jīng)說明2015年比2014年價格回暖不少。也有少部分郊區(qū)小區(qū)降價。當(dāng)然,這種漲幅和之前火箭般的漲價不可同日而語。可以肯定的是,像北京這樣的城市,房子幾乎是不可能大跌的。但未來的事情,誰知道呢?

安得廣廈千萬間,大庇天下寒士俱歡顏!

文章已經(jīng)很長,因此沒有將更多的內(nèi)容囊括其中。我們還做了以下的事情:

  • 分析不同小區(qū)漲降價的原因并將其可視化到地圖上。
  • 同一個小區(qū)中,不同的房子價格差別很大,甚至能差兩萬元。為什么會出現(xiàn)這種情況?
  • 根據(jù)房子周邊的學(xué)校,醫(yī)院,商場等場所,計算房子的附加價值。
  • 嘗試預(yù)測不同小區(qū)未來的房價趨勢。

附錄:

樣例數(shù)據(jù)下載

鏈家在去年有約7W條數(shù)據(jù),今年的出售二手房已經(jīng)達(dá)到10W套,但是這些房源里有多少水分呢?根據(jù)2014年的數(shù)據(jù)按照編號檢查一下重復(fù):一萬兩千多套房子出現(xiàn)了兩次,將近五千套房子出現(xiàn)過三次,甚至有一套房子出現(xiàn)過八次。其中水分可想而知。

同時,2014年的網(wǎng)頁數(shù)據(jù)還會提供地理坐標(biāo)信息,2015年就不存在了,所以文中涉及到地理信息的圖表都是2014年的。另外,雖然對房子的位置描述非常詳細(xì),但中介不會告訴你這是幾號樓幾層。僅僅提供了樓房的總層高。原因不言自明。

同樣,數(shù)據(jù)的準(zhǔn)確性也有問題。很多房子價格都是1萬,2萬,明顯是隨意標(biāo)的。也有一部分價格高的離譜,如88萬/平。這些數(shù)據(jù)在處理前都已經(jīng)篩掉。以免干擾分析結(jié)果。

責(zé)任編輯:李英杰 來源: 碼農(nóng)網(wǎng)
相關(guān)推薦

2012-11-14 15:32:17

探索性數(shù)據(jù)分析空間統(tǒng)計學(xué)JMP

2015-08-27 10:02:59

2024-01-29 18:04:24

前端框架TypeScript

2025-03-13 10:05:26

2010-09-27 14:37:10

評測SSL VPN

2015-12-03 16:39:09

2022-03-02 17:12:57

序列化框架測評

2018-08-27 07:01:33

數(shù)據(jù)分析數(shù)據(jù)可視化租房

2020-08-31 08:45:43

多表查詢SQL數(shù)據(jù)庫

2011-04-14 10:44:41

戴爾技術(shù)論壇

2014-01-21 16:42:48

IT運(yùn)維運(yùn)維數(shù)據(jù)監(jiān)控平臺

2021-03-25 15:15:47

大數(shù)據(jù)程序員互聯(lián)網(wǎng)

2014-12-22 10:07:10

程序員

2015-07-28 17:30:20

徐亞波

2010-12-02 10:07:57

2022-01-04 22:24:29

加密貨幣支付工具數(shù)據(jù)

2025-05-30 05:00:00

數(shù)據(jù)分析大數(shù)據(jù)數(shù)字化

2011-10-20 13:31:41

筆記本評測

2012-11-07 09:55:14

IE10Windows 8

2019-11-20 18:32:07

虎博科技
點贊
收藏

51CTO技術(shù)棧公眾號

中文字幕av日韩精品| 爱情岛论坛成人| 欧美经典一区二区| 在线观看wwwxxxx| 欧美激情免费在线| 韩国精品久久久| 婷婷五月在线视频| 国产精品视频自拍| 亚洲三级电影网站| 免费一级欧美在线大片| 韩国福利在线| 欧美成人一区二区| 免费福利视频一区| 免费日韩中文字幕| 韩国精品在线观看| 玖玖精品在线视频| 99久久99久久久精品齐齐| 污污片在线免费视频| 欧美自拍资源在线| 91麻豆精品国产91久久久久久| 9999国产精品| 懂色av中文在线| 欧美日韩视频在线一区二区观看视频| 欧美午夜一区二区| 久久久精品性| 澳门av一区二区三区| 国产精品69页| 国产精品自产拍在线观| 午夜天堂影视香蕉久久| 亚洲深爱激情| av免费在线一区| 欧美中日韩免费视频| 精品国产一区二区三区忘忧草| 久久中文字幕导航| 亚洲精品乱码视频| 自拍偷拍亚洲一区| 亚洲一区二区视频| 久久天堂精品| 国产厕拍一区| 黄色网页网址在线免费| 自拍偷拍国产精品| 亚洲视频福利| 视频一区中文字幕精品| 九色蝌蚪在线| 国语对白做受xxxxx在线中国| 成人黄色中文字幕| 国产视频精品一区二区三区| 国产精品久久久久久久久久久免费看| 国产一区二区中文| 久久在线观看| 97超碰资源站在线观看| 成人亚洲一区二区三区| 欧美一区三区二区在线观看| 欧美精品激情在线观看| 日韩精品视频观看| 亚洲最新视频在线播放| 成人黄色大片在线观看 | 在线国产中文字幕| 99热都是精品| 国产高清精品一区二区| 国内精品小视频在线观看| 欧美大片拔萝卜| 日韩欧美在线免费观看| 亚洲免费资源在线播放| 久久免费偷拍视频| 国产精品伊人色| 久久成人国产| 在线观看日韩av电影| 欧美手机在线| 麻豆视频一区| 6080成人| 亚洲国产一区二区三区网站| 香蕉久久免费电影| 在线视频cao| 在线免费日韩片| 美女高潮在线观看| 91在线中文| 国内精品不卡| 色黄网站在线观看| www久久日com| 亚洲性图自拍| 国产777精品精品热热热一区二区| 暖暖日本在线观看| 免费在线小视频| 成人精品三级| 亚洲日本va中文字幕| h视频久久久| 日韩成人三级| 欧美一区二区三区久久精品茉莉花| www.4438全国最大| 天天干天天草天天| 国产精品成人久久电影| 内射国产内射夫妻免费频道| 最新精品视频| 日韩成人午夜影院| 神马午夜伦理影院| 欧美一区三区二区在线观看| 欧美日韩大片一区二区三区| 色一情一乱一伦一区二区三区丨| 成人黄色大片在线免费观看| 91久久精品在线| 国产精品一区视频网站| 日韩欧美亚洲日产国产| 国产精品69久久久| 这里只有精品66| 男女激情无遮挡| 五月婷婷六月合| www.久草| a在线免费观看| 成人久久网站| 亚洲一区二区三区四区电影| 日韩伦理视频| 日韩av在线免费观看不卡| 国产成人av一区二区| 91在线观看地址| 色婷婷综合久久| xxxxx成人.com| 97香蕉超级碰碰久久免费的优势| 古典武侠综合av第一页| 艳母动漫在线免费观看| av手机天堂| freemovies性欧美| 韩国三级成人在线| 欧美激情电影| 久久精品久久久精品美女| 国产色91在线| 精品国产免费人成电影在线观看四季| 日韩中文字幕视频在线观看| 91久久精品国产91性色| www.av中文字幕| 日本视频在线观看| 欧美男gay| 国产日韩亚洲欧美综合| 日韩亚洲欧美高清| 国产69精品99久久久久久宅男| 成人中心免费视频| 日韩不卡av| 国产精品无码2021在线观看| 2020国产精品极品色在线观看| 久久久久久久波多野高潮日日| 艳妇臀荡乳欲伦亚洲一区| 亚洲第一精品夜夜躁人人躁| 国产成人精品免费视频| 日韩人妻精品无码一区二区三区| 成人影欧美片| 国产精品成人a在线观看| 国产精品乱码一区二三区小蝌蚪| 亚洲欧洲在线看| 欧美日韩国产免费一区二区三区| 伊人精彩视频| 欧美人妖视频| 成人ar影院免费观看视频| 日韩精品一区二区三区在线观看| 久久久久se| 视频二区在线| 精品一区欧美| 亚洲人成亚洲人成在线观看图片| 538国产精品视频一区二区| 日韩av片在线看| 成人国产一区| 成人亚洲精品久久久久软件| 亚洲激情视频在线播放| 正在播放精油久久| 欧美v亚洲v| 日韩av高清在线观看| 亚洲香蕉成视频在线观看| 亚洲精品日韩在线观看| 美女网站视频在线| 久久国产精品72免费观看| 亚洲性夜色噜噜噜7777| 日本人妻伦在线中文字幕| 自拍一区在线观看| 久久先锋资源网| 国产成人精品综合久久久| 超碰在线中文| 亚洲一本二本| 精品国产乱码91久久久久久网站| 日本婷婷久久久久久久久一区二区 | 国产精品久久久久影视| 欧美在线视频导航| 午夜视频在线观看韩国| 欧美中文日韩| 欧美精品日韩三级| 高清免费观看在线| 久久xxxx精品视频| 久热精品视频在线观看一区| 黄动漫视频高清在线| 精品无人区卡一卡二卡三乱码免费卡| 久久久这里只有精品视频| 日本大片在线观看| 国产69精品久久久久777| 欧美在线视频网站| 一色桃子av在线| 日本一区二区三区免费乱视频| 国产亚洲精品久久飘花| 欧美日韩免费观看视频| 午夜一区二区三区视频| 日韩a级黄色片| 日韩精品第一区| 久久精品视频在线|