(趙式隆 資深資料科學家)
從一個資料科學家的觀點,可以分為三個階段,第一個階段是一個公開的資訊,第二層次是變成一個開放的資料,第三個層次是一個開放API。
其實台灣在前幾年於國際活動上被列為世界政府開放資料第一名,如果我們回頭來看其實目前台灣政府,包含地方政府的開放資料的網站,只是放置公開的資料檔案,有word、excel、pdf檔案格式,因為機器沒有辦法讀,充其量只是公開的資訊,並不屬於開放資料。
而如何推動中央跟地方政府公開資料,因公務員的基本作業原則是依法行政,如訂定資料公開法源依據,推動專法的產生這是我們期待的事情,但修法牽涉範圍廣大,須經長期立法歷程,目前之法源依據及施行細則,尚能符合目前需求,如先滾動式修正目前規範,再逐步推專法,並不會阻礙到台灣開放資料往前的速度。
其實資料公開重要的挑戰在於,政府公開資料將產生清理資料成本,此時該成本以及所需人力,應由何單位負擔?如果這些資料具有經濟價值,應思考有無使用者付費原則,甚至不同資料具備不同機敏性的特質,施行細則應對資料進行分級。
進一步討論,當開放的資料到開放的API,變成是說是一個M to M的方式machine to machine,就是機器直接對接,當中風險在於,API裡面可能藏著一些不太妥當的資料,但是這些資料有它的價值,所以在操作API上面,我們需要有一些資格上面的限制。
最後,技術上應制定統一標準,以及資料開放之免責規範。若將公開之資料清洗至以逆向工程都無法回復時,必然減損該資料價值,所以政府應在保有資料一定價值之下,就資料清洗事項訂立作業原則,如符合該作業原則即滿足資料清洗之要求,縱使外界以特別方式回復該資料時,即可將該作業原則作為免責標準,如此一來,將有助資料公開。