像急診室病床的視覺化,可以即時知道每一個醫院中有多少空的床位。但有一件事沒有被討論:看床位其實是沒有用的,也不能只從這來決定病人要送到哪裡。其實在救護車運送過程中就有系統會處理這個問題。我們須要的是資訊,但這一切都還只是資料的視覺化 (data visualization)。
g0v 的工程師不懂資料(背後的脈絡),因為資料要拿來用的時候,我們需要的是資訊,工程師可以很容易地把視覺化做出來,但要把這一切放到脈絡下,要說故事的那個人就不存在了。
目前並沒有這一套處理資料的 SOP。大家也不知道該怎麼去做,我今天在新竹市政府,他們開放 160 項,每一項都很棒,但每一項仔細看會發現都不足(品質,內容),因為那是要滿足政府需求產出的東西,那是有目的的,並不是要拿去外面做賺錢加值的事情。PPP 應該要在這邊進入,如何產生新的(政府與民間的)關係,這不是講 BOT 的東西,而是說在這一塊如何延伸。而 g0v 就是一直在努力這一塊。
所以在這裡面我會認為所有的東西都可以是資料,只要我抽離 context。同時要有一定的程序跟步驟,但我們該從整個流程源頭的地方就開始處理,如果到後面才處理(轉開放資料)是根本來不及。目前的作法就是,把這些非結構,不清楚的東西丟給資訊單位去做,而資訊單位是無法接受那麼多的東西。
對於資料與資訊的分別,我有不太一樣的看法。什麼時候叫資訊,什麼時候是資料?其實 context 才是重要的地方,目前政府開放資料很多是從業務報告過來,不是最原始的資料轉過來。資料變為報告之後,已經跑過一層程序了,然後再整理成開放資料時,很多問題都因此而來。這些所謂的開放資料其實是完整的報告書,並不是要讓你拿來做運算或處理分析的。