2020年3月23日 星期一

運用Tableau建構2019冠狀病毒(COVID-19)本地疫情追蹤故事

去年底趁修畢碩士課程的一段空檔期,學習了Tableau Desktop的基本知識並僥倖地考獲Tableau Desktop Specialist資格,之後一直想動手加以應用來磨練數據視覺化(Data visualization)的技能

訂閱有線電視OTP app和New York Times後,對於「手機煲新聞」已不以為然,近月更因香港2019冠狀病毒(COVID-19)疫情習以為常了 (準確點說,大早於自去年反修例風波已習慣在跨媒體直播平台睇Live)。

上周日(3月15號)也在風雨欲來前在面書上就疫情數字寫了以下數點觀察:

//
(5) 每日平均新增3單確診個案,2月24日起開始浮現無病徵(Asymptomatic)的新型冠狀病毒確診個案,踏入3月頭無病徵個案比例更有所增加。早前香港已出現首宗潛伏期長達21日的確診個案,顯示隱形患者早已潛藏社區隨時爆發

(6) 1月份本港大部分確診為輸入個案,2月本地感染個案相對較多,到3月輸入個案比例開始回升 (多數有外遊記錄)。近日因應歐美疫情擴散,港府又向歐洲神根地區的26個國家發出紅色外遊警示,相信黎緊外地回流返港人士(特別留學生)會有所上升,香港人一定要提防社區爆發風驗

(7)睇番過去24天本港入境數字,在局部封關措施仍然生效下,每日平均大約仲有萬九幾人經機場、港珠澳及深圳灣通道入境 (過去兩個周日入境人次平均都有接近兩萬三人,但隨著政府宣佈擴大強制檢疫範圍,預計呢個禮拜海外回流返港人流會明顯增加)
//

沒料到一周後本港第二波疫情已經殺到埋身,確診數字急劇上升 (主要以輸入個案為主),單是3月(截至3月21日)已錄得178確診個案,超越1月和2月確診總數。令人擔憂的是,當中無病徵個案數字更有上升趨勢,有關確診人士在病毒潛伏期間很可能已不自覺的在社區播毒。因此有本地傳染病感染專家(如梁卓偉、何柏良教授)先後提出限制市民不必要社交聚會達至保持社交距離(social distancing)、限制非港人入境達至堵截源頭等強硬措施,絕對是港府非常時期當下馬上立即應做的事。

鑑於數字每日更新,為確保數據真確性,是次用Tableau製作疫情追蹤時,數據來源多採集自官方發布渠道。這次由於分頁較多,因此建構了故事(Story)模式以結合不同分頁Dashboard以綜合相關數據。

是次分別使用了Python進行數據清洗同抓取(raw data主要以csv檔發佈),並結合Google Map Geocoding API以便找出有關強制檢疫地址的地理坐標(Latitude,Longitude)和地方分區。當發現回傳的數值出現異常,便再以民間制作的「香港地址解析器 Hong Kong Address Parser」作進一步mapping (最花時間的工序莫過於此,單是統一地址格式做mapping已很繁複,因此用Python寫了簡單coding自動化這部分)。

有興趣與Tableau故事進行互動Drill down新問題的朋友,歡迎訪問 https://public.tableau.com/profile/marco.cheung#!/vizhome/599c/Story,有關數據將盡量進行每天更新,謝謝!


分頁1: 本地個案主要數字



分頁2: 599C名單大廈分區分佈圖



分頁3: 599C名單大廈分區數字



分頁4: (於14日檢疫期內)接受家居檢疫數字



分頁5: 本地確診患者個案發病特性



分頁6: 本地確診個案流行病學統計



分頁7: (過去24天)本港入境人次



數據來源
(1) 本港疑似/確診2019冠狀病毒的個案詳情 http://www.chp.gov.hk/files/misc/enhanced_sur_pneumonia_wuhan_chi.csv

(2) 過去14天內曾有疑似/確診個案居住過的住宅大廈; 或過去 14 天內曾出現兩宗或以上疑似/確診個案的非住宅大廈 http://www.chp.gov.hk/files/misc/building_list_chi.csv

(3) 根據香港法例第599C章正在接受強制家居檢疫人士所居住的大廈名單 http://www.chp.gov.hk/files/misc/home_confinees_tier2_building_list.csv

(4) 根據《若干到港人士強制檢疫規例》(第599C章)有效強制檢疫令(於14日檢疫期內) 的統計資料 http://www.chp.gov.hk/files/misc/active_quarantine_orders_cap599c.csv

沒有留言:

張貼留言