因為我們都是data-centric API design,可以在上面做出更多的應用來,光是microblogging就把每一個站的排班表等等就等於是他們的資訊盒,像Wiki是很後來才用,這就是變成是他們無可取代的訊息匯流排。
但如果一些少數的人在裡面,開始找到一個能夠把這個東西丟上去,跨部門來用... 像英國的一家鐵路公司SE Railways就是用裡面最簡單的microblogging的功能,也就是在臉書上或者是推特上做每一個班誤點的通報,他們就趕快用hashtag的代號,這就是非常便宜的方式。但是這些資料也算是公司機密,所以不能用推特作這件事。
如果是above the flow of work,一開始做一套,後來又做一套,即使大老闆說要這個、顧問費隨便算,一年之內一定解約,即使畫面再漂亮都沒有用。
我們在導入的時候,在09年的時候我們寫了一篇分析報告。導入成功跟失敗有一個很簡單的看法,這個系統進去的時候,如果能讓他們的業務中間生出更漂亮的東西,我們叫做in the flow of work,就是在工作過程中使用的東西,就會成功。
公務員當時常常會上開心農場,雖然本來沒有FB,但為了要上開心農場,所以學會上FB。我們建了一個內網,同時配上Wiki,所以大家互動的紀錄就會慢慢把懂的事情留下來,大客戶是醫療相關或者是國防相關,澳洲政府也是早期的用戶,都是比較在意intranet隱私的,不然他們就是用FB或者是google就好了。
就是這一家公司賣給另外一家公司。當然還在跟蘋果合作,不過那個是興趣,這個是2008年我進去跟發明試算表的人當同事,我們那時候做的就是FB for Work或者是Google App for Enterprise的事情。
我自己的想法,我在退休之前,我2013年退休...
是,這講很多次了。
兩個人來寫都一樣的內容的話,這不會受著作權保護。
我的意思是學歷不足,就要繞好幾層...
當年在自由軟體鑄造廠,我是印表機耗材...
g0v的模式主要是建立在兩套系統上,就是共同編輯的文件和試算表系統。也是大家不用學習就會的東西,因為跟office長得差不多,可以留下足夠多的資料,讓大家去貢獻一點時間。
這邊串起來就好。
對,因為現在符合這個標準沒有什麼好處,未來是如果符合標準就會自動有視覺化等應用。
如果有中央標準,通常比較沒經費的縣市就會使用。不然每一個都一套,簡單講就是這樣。
歡迎挖坑!
但Whisky講的是numeric data,sensor產生出來的東西就是給機器看的,人不太能夠直接賦予意義,就會有數據到資訊的處理需求。
剛剛我們定義裡,Whisky所說的就是我剛剛說數據的部分,我剛剛特別通常講的,是文字資料一開始是給人看的,所以g0v做很多事情,讓它也可以給機器看。
大概先講到這邊,有沒有人對定義或者是框架要討論的?在進入實體之前?
所以一開始的定義,就也包含開放資料跟公民參與的關係。
右邊是曾經做過自經區溝通會的管爺,他有這樣的想法,就是即使想辦法把政策說出來,但如果沒有傾聽、參與的空間,那等於就是說服,力量其實是不那麼強的。
左邊柯P表示說,如果讓大家知道有參與式預算,但不解釋說預算是什麼回事,就問大家的意見,那不能說是參與,這是民粹。
最後一張slide,是最近有兩位也是自己試著做過開放跟參與的人,各自有感而發的各說一句話,這二句話我覺得很好玩,所以就放上去。
所以我加入課發會主要做的事情,是把逐字稿系統介紹給課發會,我一個人打了兩篇6萬字,後來就變成一個可以取代錄音,比錄音還好的逐字稿系統。原本當然是為了防弊,後來也發現有興利的作用:每一次開會之後有哪一些決議或者是小組的人就可以track,然後就可以馬上開始做。如果要事後整理,其實往往就不記得下一次要做什麼。
我自己通常會舉一個例子是我進課發會,因為當時發生課綱案,裡面有一個很關鍵的是,教育部覺得委員會已經錄音了,但如果當時是覺得沒有要公開,事後公開的話,會違反信賴保護原則。這就是所謂的「先有資料再開放」會碰到的問題,因為當時蒐集目的跟事後的利用目的是分開的。
「開放資料」是主動的,使用metadata-aware tools,你在創造資料、做的時候那一件事情本身,我們在資料交換的時候,就一併存了一份可以開放的版本,這樣的話,這樣才能在我們產生資料的時候,那個脈絡才可以被繼續下去。
「資料開放」跟「開放資料」是名動形式跟動名形式,其實是不一樣的。前者是先有資訊再決定要不要公開,但這樣的問題是在資訊、資料先累積的過程中,等到要開放的時,在中間跟中間資料的脈絡是會消失或者是必須要重建,像是現在21世紀你要去猜當年的作者是誰,這個是草稿或者是贗品或者是倣製。
接著是開放資料,如果我們完全只是講政府把資料開放的話,最常的是資訊公開法,但資訊公開法對東西的定義只是public「不特定人可讀」,但我們現在做open data是附加的,還要能夠改作,也就是要做衍生的著作,在著作權上不做額外的限制。另外是要允許自由的改作,也就是你釋出的資料不能跟微軟簽了一批很貴的約或者是跟其他的大廠簽很多的約,所以一定要用XML、JSON、CSV這一類的格式來釋出,所以開放的要件是除了不特定的人之外還有「自由」和「改作」。
但是我在這五年來幫Apple開發Siri,都是處理文字資料,並不是數字資料,所以我並不會用數據來想。我們用數據來想時,都會直接往sensor走,但我覺得結構化的文字資料是開放的大宗,也可以做很好的結構化處理,這個是資訊跟資料的區別。
另外一個關鍵字是開放資料,我自己在DataSci.tw那一場其實也有講到:人可以看得懂的是資訊,我們在中文裡面,至少在字典裡面,「數據」都是資料,但資料不一定是數據。我自己通常說數據是指numeric data,量測出來給機器的是數據。
有一派覺得PPP是公私協力,是公部門跟私部門的合作。但我們是公部門跟第三部門的協力,像跟NGO的協力,但當然裡面也會有私部門的利益關係人,只是結構上不是促參,這個是我自己理解的方式。
其實剛剛有提到PPP跟公民參與主要的一些差別,我想我把我理解中的定義跟大家分享,如果定義OK的話,就大家自由聊,如果定義很不OK,我們就直接談定義。
今天很開心來這邊,這和我今天在環保署是同一份簡報,內容也是公開的。
這是非常好的主意。那就交給你了,麻煩在hackpad上寫一個計劃,謝謝。(笑)
剛才的那六點其實彼此之間是有衝突的,但建議是公共部門可以回應的。感受跟期待:是在什麼樣的感覺底下做出這樣的建議?這是客觀的。但是要怎麼分出感受、期待或者建議,它當然多少有一些主觀的因素在裡面。
非常好的問題。為什麼我們叫做意見徵集?重點就是說這些數字本身不賦予意義,我們只是選擇出在第一階段要討論哪些問題而已。另外一個,我們希望越多樣的意見出來越好。
不會。
join試了不同的方法,他們有0800的專線,你可以任何時候打進去,會幫你記下這個意見,如果有回應的話還會打電話給你,這讓更多人參加。所以我覺得這是在於政策實行各個階段,這個部分是特別適合的,並不是競爭的關係。
沒有,我們是它們的上游,vTaiwan這邊只討論跟網路使用者為主要的利益相關者,因為我們不希望討論有不當代表的人。join沒有挑這個,所以上面例如有通姦除罪化、同性婚姻,但是我們沒有任何研究顯示說,這兩個議題的利害相關者是重度的網路使用者或者有任何重疊性,因此我們不討論這個,我們只做利害關係人的討論平台。
我們跟媒體的合作也是這樣的概念:我們是供稿的,他們願意採納就採納。
第三部門要有第三部門的樣子,我們的樣子就是fork the government:我們並不是否定現成的所有東西,fork的意思就是拿現在的東西往一個不同的方向去開發,如果那個開發是好主意的話我們希望本來的那個主線能夠合併進去,否則的話反正大家都是自願的,沒有什麼成本。
第二個問題,我們跟媒體的關係其實跟政府的關係差不多。這邊的政府發文給零時政府的時候其實真的是給『零時政府 高村長 嘉良』,這是一個特殊的政府對政府的關係。
我非常快速地回答,因為第一個只要一句話來回答:歡迎你來挖坑,請到g0v上面提一個專案,我目前還沒有看到,但是只要你提了就有人做。
最後,非常感謝挖坑的人和填坑的人。謝謝大家!
這裡為大家挖一個坑,我們在下個星期四的行政院公開直播,包含Uber的人、交通部的人,以及計程車隊和公會的人,都會對資料做一次討論。Uber目前已經出了一份分析報告,如果各位資料科學的前輩朋友們願意下載一下我們的這個平台,我們全部都會合併到下星期四的報告裡面。
最後是產生一些共同建議:公平管制規則,不是因為Uber的公司名稱有英文就要幫助。設計一套法律,我上了Uber的車上之後怎麼知道那個人是那個人、那台車是那台車?交通運輸還是有一些公共性,即使Uber宣稱它是免費平台,還是應該像食品藥品這樣嚴格地把關。還有人說自用車載客可以登記,上下班的時候順帶載一些人。
也有一開始相當兇的人說『應盡一切努力使其停業,不需要國人表示意見』,最後65%的人表示反對,65%的人覺得應該還是要討論一下,之後如果你要認為它不合法,你再說它不合法。
到最後的重點其實並不只是這些群組怎麼想,而是大家跨群組的感受。大家都覺得法律是可以根據科技來修改的,安全是最重要的,乘客保障是最重要的。95%的人覺得如果政府可以應對Uber的挑戰,把計程車也升級,慢慢計程車有一套評價的方式,這樣的話司機也可以獲得很好的服務品質。
雙方會互相拉票,因為這個意見的關係,我們可以看到第二群組多了2%左右的票。
隨著時間的過去,他們會一直想要著出新的論點來說服其他人,所以群組一的人修正他們的論點,其實他們的重點是交通部還是有責任去取締,這邊就說計程車司機都要加入車隊才能生存、如果也加入Uber的話可以顛覆這項不成文的規定。