国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

用數據告訴你,新型冠狀病毒傳染性有多強?

大數據 數據分析
本文探討的主要目的是,有沒有一種算法可以根據已有的數據對疫情進行預測和評估,可以方便在疫情出現的時候,根據預測的數據來判斷當前的疫情狀況。
  • 新型肺炎疫情牽動著全國人民的心。截至 2020 年 1 月 27 日 11 時 54 分,全國新型肺炎病例已確診 2762 例,死亡 80 例,治愈 51 例。

[[313606]]

用數據告訴你,新型冠狀病毒傳染性有多強?

00聲明&目的

作為一名碼農,我們用數據說話,下面為大家分析目前的新型冠狀病毒真的嚴重嗎?

聲明:

  • 本文只是一個學術的研究,能夠獲取的數據維度非常單一且數據量也少,并無任何實際的價值和參考意義,請不要對號入座,請不要隨便斷章取義,歪曲本文。
  • 本文的數據來自于 WHO,國家衛檢委,騰訊新聞和澎湃新聞美數課。全部人工抄錄,如有錯誤之處,敬請指出。
  • 本文寫于 1 月 26 日,當時獲取到的信息非常有限,得出的結論可能會被后續更多的數據被推翻。再次聲明,所以本文僅是一個學術的探討,僅僅是一個思路,并無實際的價值和參考意義。
  • 本人也是個菜雞程序員,可能會有數據錯誤,程序沒寫好,有 Bug 等,歡迎指正批評。一起探討學習。

目的:本文探討的主要目的是,有沒有一種算法可以根據已有的數據對疫情進行預測和評估,可以方便在疫情出現的時候,根據預測的數據來判斷當前的疫情狀況。

文章分為如下五個部分:

  • 猜想
  • 數據準備
  • 猜想驗證
  • 新型冠狀病毒確診數據的預測和驗證
  • 總結

PS : 心急的朋友可以直接拖到末尾看結論。

 

用數據告訴你,新型冠狀病毒傳染性有多強?

圖片來自丁香園

 

01猜想

由于當前新型冠狀病毒的數據并不多(從 11 號-26 號),所以僅僅是新型冠狀病毒的數據來做研究是不夠的,必須還要一組參考驗證組。(當然是越多越好,但是精力有限,所以只找了一組)。

首先明確一下判斷疫情的嚴重情況的指標,目前疫情一般會公告這四個數據:

  • 確診病例
  • 疑似的病例
  • 感染的地區
  • 死亡的人數

由于我們把地區限定在了中國(雖然各個地區不一樣),所這個地區的指標就不用了,死亡人數在疫情的前中后期都不太一樣,這個也不用。

疑似病例這個和各地的收診情況有關系,比如香港的疑似病例就非常多,確診很少,所以這個指標也不采用,剩下就以確診病例作為唯一的參考指標。

猜想 1:假設病毒的傳播和地區,氣候以及病毒自身的特征有非常大的關系。

那么只要找到一個和新型冠狀病毒這三個屬性非常相似的病毒,只要算法能夠對這種病毒的確診病例進行預估和判斷,那么算法也可以對新型冠狀病毒進行預估和判斷。

 

用數據告訴你,新型冠狀病毒傳染性有多強?

2003 年 4 月 22 日 SRAS,圖源..不太清楚

 

目前和新型冠狀病毒最像的應該就是 SARS:

  • 氣候和現在差不多,都是 1 月開始,但是 SARS 在 3 月才擴散。
  • 地區主要是是中國。
  • 病毒類型:都是冠狀病毒,都有發燒咳嗽等特征。

那么基于上述的條件,采用了 SARS 作為參考組。

猜想 2:可以給定一個 Δ。

  • 如果當前確診的病例-預測的確診病例的比率>Δ,那么當前的疫情變異了,進一步擴大影響的范圍。
  • 如果當前確診的病例-預測的確診病例的比率<-Δ,那么當前的疫情已經基本被控制,已經減弱了。
  • 如果-Δ<當前確診的病例-預測的確診病例的比率<Δ,那么當前的疫情還在平穩的發展中,沒有進一步變異。

02數據的準備

  • 確診病例的數據:
  • SARS 的數據來源于 www.who.int , 數據從 2003 年的 3 月 17 日-5 月 30 日 。
  • 新型冠狀病毒的數據來源于騰訊新聞和國家衛生健康委員會 http://www.nhc.gov.cn 數據從 2020 年的 1 月 15 日到 1 月 26 日。

如果可以拿到 SARS 在 1 月份的數據就好了,可惜沒有一個比較完整的地方有記錄,基本上衛生部發布的好像是從四月份開始。于是只能采用四月份的數據了。

評估的算法:采用了 LSTM(長短期記憶網絡),搭建的話 Keras。

LSTM 已經是個老算法了,經常用于量化投資(簡單點來說就是炒股之類,預測股票的增長),非常擅長于時間序列的預測。

最終調教后的算法模型是,根據過去三天的數據,可以預估最新一天的數據。

 

用數據告訴你,新型冠狀病毒傳染性有多強?

LSTM

 

實驗的環境:數據量比較少,直接租了一臺 16 核 8G 的阿里云的主機進行測試。

03猜想驗證

猜想驗證部分直接全部使用 WHO 的 SARS 的數據進行驗證。采用的字段是 Cumulative number of case(s),累計病例數,我這里就當它是確診人數了。

SARS 的數據分別有兩部分,一部分是中國大陸的,一部分是中國香港的。在 5 月份后基本已經趨于平緩,所以只取了前兩個月(約 60 天左右的數據)。

 

用數據告訴你,新型冠狀病毒傳染性有多強?

中國大陸確診人數變化曲線

 

 

用數據告訴你,新型冠狀病毒傳染性有多強?

中國香港確診人數變化曲線

 

可以看到數據涵蓋了病毒爆發期,病毒平穩增長期,以及病毒被消滅期,比較合適用來驗證算法是否可以擬合整體的曲線。

猜想 1:這里采用前 50 天的數據做訓練樣本,訓練的結果用來預測 60 天的情況。

預測和實際的對比如下:

 

用數據告訴你,新型冠狀病毒傳染性有多強?

中國大陸 SARS 確診人數變化曲線(預測和實際)

 

 

用數據告訴你,新型冠狀病毒傳染性有多強?

中國香港 SARS 確診人數變化曲線(預測和實際)

 

從圖中我們可以看到,在使用了 90% 的數據量下,數據是擬合的比較好的,肉眼看上去香港的數據基本可以用算法完全預估。

這里給一下數據誤差的對比情況:

  • 誤差:|(實際值-預估值)/ 實際值 |
  • 中國大陸:誤差的平均值 0.057, 誤差的均方差 0.060。
  • 中國香港:誤差的平均值 0.053, 誤差的均方差 0.137。

說人話就是,模型預測的數據和實際的數據最多差了 6%。效果是非常理想的。這里我們可以證明第一個猜想,即 LSTM 可以用來擬合 SARS 確診人數的變化情況。

猜想 2:實際上雖然猜想一得到了證實,但是依舊沒啥用,因為這里的模型是使用了 90% 的數據,基本已經到了傳播的后期。

那么前期是否可以使用同一個模型進行驗證呢? 這里只取中國大陸的數據進行試驗。

用數據告訴你,新型冠狀病毒傳染性有多強?

根據三個階段(這三個階段是肉眼判斷截取的,是否合理當時沒有考慮)截取對應的數據進行建模,建模后的預測效果如下:

 

用數據告訴你,新型冠狀病毒傳染性有多強?

前期的數據建模人數變化曲線(預測和實際)

 

 

用數據告訴你,新型冠狀病毒傳染性有多強?

中期的數據建模人數變化曲線(預測和實際)

 

 

用數據告訴你,新型冠狀病毒傳染性有多強?

后期的數據建模人數變化曲線(預測和實際)

 

在前期的數據的預測中,到后面兩個階段實際的數據都比預測的數據比要大,說明在疫情開始了爆發。

在中期的數據的預測中,其他兩個階段預測的數據基本都比實際的數據要大, 說明在疫情在前期的感染速度較低,后期的感染速度也變低 。

根據上面兩個數據,是可以推測是存在一個 Δ 去判斷當前的疫情狀況的。但是 Δ 究竟是多少呢?

這里倒是可以根據好幾個因素去設置:

  • 斜率的改變
  • 誤差的改變
  • 轉折點的個數等

這里就偷懶了,可以明顯看到各個時期都有一個或者多個轉折點(消亡期不算)。

直接取最接近轉折點的誤差率來計算:

  • 在爆發期里面,最靠近轉折點的誤差值是 0.21。
  • 在控制期里面,最靠近轉折點的誤差值是 0.14 。
  • 兩個取平均作為 Δ 的值,也就是 0.175 。

04新型冠狀病毒確診數據的預測和驗證

 

用數據告訴你,新型冠狀病毒傳染性有多強?

新型冠狀病毒從 16 號至 26 號確診人數變化曲線

 

分別取前 6 天的數據(到 20 號),取前面 9 天的數據(到 25 號)的數據代入模型進行預估:

 

用數據告訴你,新型冠狀病毒傳染性有多強?

到 20 號的數據模型確診人數變化曲線(預估和實際)

 

 

用數據告訴你,新型冠狀病毒傳染性有多強?

到 24 號的數據模型確診人數變化曲線(預估和實際)

 

為什么選 20 號呢,20 號主要是央視有采訪鐘南山大佬,而且第一次說明了人傳人的存在,以及 14 名醫護被感染。

我覺得應該算是開始重視這個病毒的一個點,隨后各地開始上報疫情,發布以及響應等。

再往前的時間點就數據就比較缺失了,模型精準度已經失去了使用的價值,所以采取了 20 號的這個時間點作為分隔來建造模型。

如果以到 20 號的模型來估算的話,第一次誤差偏離 0.17 的時間是 23 號,誤差為 0.19。23 號,廣東,浙江啟動了一級響應,確診的病人增多。

但個人感覺應該是檢測的方法變強導致的,側面來看,模型的確檢測除了異常值,不過并不能夠說明病毒變強了。

如果以到 24 號的模型來看,預估的 25 號的數據是 1877,實際的數據 1972,誤差率在 0.04,未到偏離值。

所以根據這個模型推斷,當前疫情還在持續擴散中,但是并沒有進一步惡化,可能國家的高度重視和很多省份都開始參與其中有關系。

依照當前的模型,明天的確診人數的預估值是 2770,加上 0.17 的誤差的話:

  • 如果實際的確診人數>3337,說明疫情加重。
  • 如果實際的確診人數<2367,說明疫情正在被控制。
  • 如果處于中間,那還是依舊在擴散發展中,但并未惡化。

再次聲明:以上的觀點和結論都屬于依據當前的確診人數所作的推斷,毫無參考的意義和價值。如果數據剛好對了,不能說明什么,如果數據錯了,證明這個模型真的不行。

那么,如果我們帶入 SARS 最嚴重的的時候,會怎么樣?

用數據告訴你,新型冠狀病毒傳染性有多強?

還是按照誤差 0.17 來算,在 23 號,誤差達到了 0.18,也就是 3 天前,按照這個模型的數據推算,新型冠狀的病毒傳染性比 SARS 要強。 但很可能是和春運有關系,畢竟數據的時間不一致。

再再次聲明:以上的觀點和結論都屬于依據當前的確診人數所作的推斷,毫無參考的意義和價值。如果數據剛好對了,不能說明什么,如果數據錯了,證明這個模型真的不行。

05總結

寫這個的目的純粹是為了探討和研究,實際上,真的要寫一個這種疫情預測和評估的系統,需要非常多的參考的數值。

比如醫護人員的數量,檢測手法準確率,時間,病毒的潛伏期等等,需要非常多的人力物力才可以編寫完成,像本文這種只靠單一維度的輸入去判斷和預估的模型和玩具沒什么區別。

但是在編寫的過程中也發現很多問題,例如政府之前的披露的數據真的非常少,疫情的相關數據還是多方尋找才找到一部分 。

希望在這次的疫情中保留比較詳細的數據:

  • 例如支援的物品的統計,損耗和使用情況等
  • 例如病人的數量對物品的需求等
  • 例如疫情各個時期需要多少的物資統計等

這些都可以作為系統的的輸入,借助這些數據,打造一個強大完整的疫情監控和評估系統,甚至不是疫情,而是重大事件的監控和評估系統,待下次再出現疫情、災情,可以快速的調度全國的資源進行處理和援助。

最后,祝大家春節快樂,多注意個人衛生,帶好口罩,不要放松警惕。

 

用數據告訴你,新型冠狀病毒傳染性有多強?

責任編輯:未麗燕 來源: 51CTO技術棧
相關推薦

2020-02-05 10:33:58

架構技術棧微信半月刊

2020-02-06 12:37:59

新型冠狀病毒勒索病毒病毒

2020-03-27 09:49:50

數據中心運營商新型冠狀病毒

2020-03-27 09:10:49

新型冠狀病毒遠程網絡

2020-07-07 10:00:00

技術

2020-03-09 21:02:26

疫情NAND閃存存儲

2020-06-02 16:34:57

區塊鏈新型冠狀病毒區塊鏈技術

2020-02-04 19:26:08

人工智能AI新型冠狀病毒

2020-02-05 18:13:22

IBM

2020-02-25 16:54:21

數據分析Python疫情

2020-03-20 20:24:52

人工智能AI新型疫情

2020-02-28 09:17:16

冠狀病毒移動安全病毒

2020-02-04 16:15:08

IBM中國

2020-04-29 11:32:31

NEC

2020-04-03 09:09:08

新型冠狀病毒肺炎安全經驗網絡攻擊

2020-08-26 06:30:28

后冠狀病毒物聯網IOT

2020-04-02 15:29:43

谷歌疫情COVID-9

2020-02-10 15:10:28

蘋果新型冠狀病毒Facebook

2020-10-26 10:49:31

數據中心

2021-02-18 21:51:57

大數據冠狀病毒醫療
點贊
收藏

51CTO技術棧公眾號

国产亚洲人成a一在线v站| 亚洲国产中文字幕久久网| 亚洲狠狠婷婷综合久久久| 欧美三级伦理在线| 宅男66日本亚洲欧美视频| dj大片免费在线观看| 久久精品二区三区| 久久久亚洲国产天美传媒修理工| 日韩和欧美的一区二区| av综合电影网站| 久久av电影| 欧美日韩三级一区二区| 国产精品久久久久久久久粉嫩av| 亚洲资源在线| 中文字幕精品久久久久| 爱啪啪综合导航| 亚洲精品久久久久久久久久久久| 精品176二区| 欧美精品日韩精品| 天天综合视频在线观看| 91成人看片片| 国产区高清在线| 欧美欧美欧美欧美首页| 亚洲小说区图片区都市| 日韩一区二区三区视频在线| 国产日本欧美视频| 日韩av在线播放资源| 91在线导航| 欧洲一区在线电影| 四虎在线免费观看| 色94色欧美sute亚洲13| 日韩精品一二| 欧美日韩亚洲国产综合| 日本h片在线| 99re8这里有精品热视频免费| 国产一区二区三区毛片| 成人18视频在线观看| 欧美大胆在线视频| 亚洲精品一二三**| 欧美尤物巨大精品爽| 日韩在线综合| 国产亚洲情侣一区二区无| 99热免费精品在线观看| 亚洲精蜜桃久在线| caoporm超碰国产精品| 天天色综合4| 日韩欧美a级成人黄色| 亚洲无线看天堂av| 国产一区av在线| 成人午夜av电影| 日本一区二区在线视频| 在线精品一区| 在线精品视频免费观看| 美女黄毛**国产精品啪啪| freemovies性欧美| 欧美性感一类影片在线播放| 日韩精品一级中文字幕精品视频免费观看 | 国产91精品一区二区麻豆网站| 精品视频无码一区二区三区| 亚洲图片欧美色图| 麻豆电影在线播放| 中文字幕日韩精品在线观看| 亚洲国产合集| 欧美极品视频一区二区三区| 久久综合丝袜日本网| 小明精品国产一区二区三区| 日韩激情视频在线播放| 免费成人av| 日韩欧美在线观看强乱免费| 中文字幕不卡一区| 黄色免费在线观看| 欧美精品aaa| 日韩精品91亚洲二区在线观看| 又色又爽又高潮免费视频国产| 欧美日韩你懂的| 成人三级av在线| 亚洲巨乳在线观看| 欧美日韩精品在线播放| 日产精品一区| 成人看片在线| 国产精品系列在线| 亚洲十八**毛片| 91欧美激情另类亚洲| 91视频.com| 主播国产精品| 国产一区欧美二区三区| 不卡的电视剧免费网站有什么| 成人在线免费公开观看视频| 国产+人+亚洲| 国产激情偷乱视频一区二区三区| jizz在线观看视频| 欧美一级电影免费在线观看| 黄色精品一二区| 久久久久久久影视| 91精品国产亚洲| 国产99一区视频免费| 欧美日本一道| 91精品视频一区| 亚洲欧洲中文日韩久久av乱码| 日韩三区在线| 亚洲巨乳在线观看| 欧美日韩国产一区二区三区地区| 国产传媒欧美日韩成人精品大片| 国产一区二区网| 日韩国产精品视频| 久久综合网络一区二区| 国产午夜在线观看| 国产精品香蕉av| 国产精品女主播在线观看| 国产精品原创视频| 91香蕉视频网址| 日韩欧美一卡二卡| 亚洲免费精品| 国产片在线观看| 国产主播精品在线| 亚洲女同一区二区| 免费福利视频一区| 亚洲老女人av| 久久综合网hezyo| 丁香啪啪综合成人亚洲小说| 136福利第一导航国产在线| 国产精品一区二区三区观看| 在线观看日韩av先锋影音电影院| 久久人体视频| 天堂av在线播放| 91久久久久久国产精品| 精品欧美aⅴ在线网站| 欧美亚洲高清| 一级在线观看| 3d精品h动漫啪啪一区二区 | 亚洲综合丁香| 欧美黑人激情| 日韩久久不卡| 日韩经典第一页| 国产精品自拍av| 巨大黑人极品videos精品| 久久精品无码中文字幕| 亚洲欧美综合区自拍另类| 久久国产精品99久久人人澡| 狂野欧美性猛交xxxxx视频| 日韩偷拍一区二区| 日韩大片在线观看视频| 国产99久久久国产精品| 久久久91麻豆精品国产一区| 性chinese极品按摩| 国产www精品| 色婷婷综合久久久久中文一区二区| 狠狠入ady亚洲精品经典电影| 黄视频网站在线看| 亚洲看片网站| 在线观看国产精品91| 国产欧美日韩亚州综合| 伊人久久大香线蕉综合网站| 一区二区三区视频国产日韩 | 性生交免费视频| 日韩美女写真福利在线观看| 午夜精品一区二区三区免费视频| 中文字幕一区二区三区在线视频 | 国产亚洲欧洲一区高清在线观看| 精品国产精品| 欧美日韩影视| 中文字幕制服丝袜在线| 欧美日韩免费视频| eeuss鲁片一区二区三区在线观看| 亚洲狼人在线| 欧亚精品在线观看| 亚洲视频大全| 日本大胆在线观看| 欧美精品一区免费| 国产成人精品国内自产拍免费看 | 亚洲一区二区在线观| 中文字幕精品av| 亚洲色图视频免费播放| 欧美精品激情| 高清在线视频不卡| 国产精品99久久免费黑人人妻| 国产精品麻豆va在线播放| 911精品国产一区二区在线| 国产黑丝在线一区二区三区| 亚洲国产欧美日韩在线观看第一区| 伦理片一区二区三区| 在线视频不卡国产| 97高清免费视频| 日韩亚洲国产中文字幕欧美| 久久久久久免费网| 国产一区二区中文| 日本成人在线网站| 污污的网站在线观看| a级黄色小视频| 亚洲a级在线观看| 国产一区二区三区精品久久久| 一区二区三区在线观看动漫| 青娱乐精品视频在线| 偷拍一区二区| 老牛影视精品| 免费在线国产| 天天爽人人爽夜夜爽| 污视频在线免费观看一区二区三区| 91国内精品久久| 精品亚洲一区二区三区四区五区|