開放疫情數據之觀察與思考

疫情籠罩之下,公衆對相關資訊需求大增,政府發佈會、新聞稿、部門網站公告等傳統官方資訊渠道雖然權威,但失於零碎,惟有將不同來源的已核實數據整合為更為清晰的動態全景圖,「一文睇清」,方能令市民充分知情而採取有效防範措施。新型冠狀病毒爆發後,無論海內外,官方及民間先後推出各類有簡明互動圖像的網上資訊平臺。

展示方式之外,數據如何開放,開放多少乃更深層次問題,而開放公共衛生數據的一項難題是如何處理病人私隱。

疫情資訊平臺以視覺化方式

數據視覺化(data visualization)在近年「大數據」熱潮下於傳媒、公民社會及商業項目中廣泛應用,更成為近來大型事件發生時資訊呈現的常態。「武漢肺炎民間資訊」(https://wars.vote4.hk/)是香港最早出現的疫情資訊平台,網站製作人1月26日開始行動兩日便搭建完畢,實時呈現疫情及出入境數字等,亦綜合政府消息及媒體報導等整理出高危地區的互動地圖,包括確診人士曾經逗留的地方,隔離檢疫地點等,全部註明出處。

與以往社會事件不同,今次官方亦有動作,於2月3日推出本地情況互動地圖儀表版(Interactive Map Dashboard)」,由「發展局、地政總署以及一群智慧城市聯盟的義工合力開發和管理」,同樣在地圖中標示出高危地點,亦有急診室輪候時間等,資料來源當然僅限政府。事有巧合,新加坡亦有類似的儀表版COVID-19 Situation Dashboard,連網頁載入過程中的「Loading」圖標都與香港一模一樣?!追查之下,原來星港兩地都似乎「參考」翰霍普金斯大學(Johns Hopkins University)系統科學和工程中心早於1月22日推出的「儀表板」卻未予聲明,後者數據和部分網頁代碼早已透過網絡平台Github共享,理論上人人皆可套用,但他人使用時應說明來源。

保障私隱仍是開放公共衛生數據難題

視覺化終究是呈現方式,開放數據更為核心,而病人私隱是開放公共衛生數據中的一個長期爭議點。香港衛生防護中心已經用開放數據形式每日公佈個案,其中一份清單有確診者的性別和年齡,姓名則以個案編號代替,但無住址,顯然是要保護當事人私隱,其他地方諸如新加坡、日本(只提供出生年代而無具體年齡)做法亦大致如是。不過,如上文所述,公佈確診人士逗留過的地點屬必要,有助公眾提高警覺,於是政府另行公佈一份確診者居住及到訪過的大廈名單,并註明相應個案編號。

其實,兩張清單都有個案編號,即可關聯,術語叫「開放數據連結」(Linked Open Data)。再結合其他公開資料,不難還原確診者真實身分,例如第85宗個案是一名馬主,傳媒在報導時直稱其姓名。私隱與公眾利益的矛盾是難題,統統訴諸法律手段亦不現實,一種較好的方式是呈現上避免專注個案,而採用更關乎公眾利益的空間分佈方式(例如地理圖),上述各數據視覺化平台即是如此。

在未有完美解決方案時,須抱以誠實、誠懇的態度處理,甚至能化危為機,反之亦然。

文:周穗斌(香港互聯網協會研究員)
2020年2月