高嘉良去開會的時候,全世界20幾個國家做civic tech的人聚在一起,他們統計了一下,看起來以色列跟臺灣是最活躍的,臺灣的規模又是以色列的10倍,所以高嘉良就說我們不出國比賽不知道自己第一名。可是這個第一名並不是那麼值得驕傲,如果是在英國或者美國,他們的陽光法案,本來監察院這些資料就是公開的,不需要花那麼多力氣去做這些事情。
最後就是我們自由軟體的人,我們欠缺的就是公民精神,我們平常其實真的沒有那麼關心這些事情。g0v就是把這三種人結合在同一個空間,讓大家彼此學習到彼此的優點,這樣就可以作出這三方單一都沒有辦法做出來的事情。現在有很多臉書的訂閱,有很多透明公開的專案的共筆。
g0v提供一個空間,結合社運團體,好比剛才說的核456,他們持續進去把東西印出來,他們不習慣的是什麼?是分身伐樹,他們很習慣的是十個人,然後可能花一整年,把東西都打成資料,並不習慣把它切出去拿給幾萬個陌生人一起協作,所以這是開源模式。
這樣的模式是g0v一直以來運行的模式,本來群眾媒體,像張大春或者是馮光遠,他們個人都非常有影響力,臉書隨便上發一個文就有幾百個贊,但是他們並沒有行動主義的感受。像馮光遠好了,他為什麼用比較cynical文筆來寫東西?很大一部分是因為他覺得,他寫的東西不能真的改變什麼,這樣的話就會有一種無力感。
當然,我們也可以看到有些政黨特別艱困的選區,需要許多的競選經費,民進黨也有,中間紅色的顏清標委員不太需要政黨,自己有很多的選舉經費,可以做一些比較。
好比在11/29投票的時候g0v的朋友們找到了各地的市徽,就有人說按進去發現22個候選人,我看完了補助記錄、出席記錄、投票記錄之後就只需要從兩個人選,所以這對民主的深化是有幫助的。
結構化資料可以做什麼?在座的各位比我都知道可以拿來什麼,我們只能做一些很基本的,比如說顯示。這裡沒有針對特定委員的意思,但是我們可以知道他的政治現金從哪裡來,花到哪裡去,如果他是議員的話,跟他的補助款的公司之間有什麼關聯。
所以大家都在臉書上分享,一大堆人跳出來,24小時就把它變成了結構化資料。
所以我們就把它遊戲化,變成一個數位化的網站,在上面說現在有40萬筆,每次資料包上線的時候就會有更多筆輸入。有玩過開心農場的人就知道,人類是一種很奇怪的動物,你只要看到一個數字一直跑,即使不睡覺都會想把它跑到0,只要有一個進度條,不睡覺都要跑到滿。
g0v有一個最主要的概念,就是分身伐樹的概念。我們如果把它切成低於1分鐘,每個人只要花10秒鐘就可以做貢獻,那麼他們花的時間就跟有一個評論、有一個分享、有一個讚差不多,而且他們能夠獲得心理上的快樂是勝過在臉書上發文章的,這樣的話就可以把臉書上的人吸引過來,主動變成資料的貢獻者跟提供者。
那為什麼能夠這樣呢?像馮光遠當然不可能自己跑到監察院印幾百頁資料出來,所以確實是有NGO、核456的朋友們跑進去。他們印出來之後就是這樣一張A4紙,我試過要這樣key大概要3分鐘到5分鐘,如果號召大家來捐3分鐘或者5分鐘,根本不會有人來。
專案裡有NGO、工程師可能不到四成,還有設計師,還有做文案的,很多資料包。在這裡『豆腐』的意思就是被切成一塊一塊。第一批印出來的資料大概30萬筆,號召了9700多人參與在24小時之內,每一格有三個人以上看過,這個就是所謂的宅力文字辨識 Otaku Character Recognition,大家宅在家裡沒有事的時候就花一點點時間。
當然,立法委員是最會被這個開放影響的,所以他們排案可能排到最後一案,不審這個修正案。所以怎麼辦?就有一位馮光遠,是一位國寶級的白目,他除了跟計程車司機吵架之外,也會提很多很有趣的主意。他挖了一個坑,我們用一個太陽與北風的戰略,實際去監察院印資料,然後把它拿出來、把它轉成結構化資料。監察院一定會跳出來,說怎麼能保證資料百分百正確呢,這個時候我們就可以說『好啊,你們改一下查閱辦法,你們自己去釋出百分百正確的資料』。
可是你說這是因為監察院黑箱嗎?也不是,而是因為定那個想法的那些人,本來就是卡在影印機時代的人,並沒有想到這些資料放出來是有更多的價值、應用。
玩臉書的時候大家都很懶,都只有1分鐘。如果用一句話來形容零時政府g0v,它就是一個讓大家又懶,又可以參與的真正的行動的實踐。舉一個例子,監察院的政治獻金,資料只有他們自己有,提供給民間的只有影印出來的資訊,也就是說只有監察人才能做監察,人民只能幫他做覆核。
接下來很快速地跟大家介紹一下在g0v這兩年多來,怎麼樣做Crowdsoursing,怎麼樣做眾包。2013年春Wired訪問張大春,張大春喜歡玩『臉書』,也很關心政治,然後外界問說臉書能不能影響政治,他回答『絕對不會。它會讓公民以為自己參與,好象真的有做什麼事,但是事實上並沒有改變,想不出來一個讓大家真正參與行動的實踐』。
最近跟我長期合作的呂家華,他說『技術者背後不會也不該只有技術,每個技術背後有它追求的價值』。我跟家華說我的價值在1994年開始就非常穩定了,就是持守這個價值。
我從全球資訊網得到那麼多,我也想給回一些東西,所以說我剛才的一個想法就是促進一個安全的空間,這裡隔著螢幕不會有剝奪彼此發言權的狀況,大家可以互相學習,一步一步朝向實際可行的想法或者實際可行的理念,把它實現出來。
我是1993年回臺灣的,我從一年級以後就沒有再去學校,為什麼?因為1994年發生了一件人類歷史上很重大的事情,就是全球資訊網的發明,我發現我在上面可以接觸到所有尖端的研究,而且不需要等十年時間編成教科書,就可以接觸到目前關心的事情發展到怎麼樣。
因為我爸的博士論文是做天安門學運裡面的人際關係研究,所以到德國,然後把當時流亡在德法的中國名人士結合起來,試著去做深入的訪談跟研究。我陪著他去念博士,所以整天在客廳聽到的就是要民主化,要對話,讓整件事情不要有那麼悲慘的結局。
在我開始寫程式的時候我爸剛好在天安門,他是從5月採訪到6月1號,我們知道沒幾天就發生天安門事件,因為這樣的關係所以他對學生運動起了非常大的興趣,1989年年底去了柏林,當時有一個柏林圍牆倒塌的事件。當時東德警方沒有開槍,很多人都覺得是因為已經發生了6月那件事情,他們不想要重蹈覆轍,當然1990年臺灣野百合,也都會有類似的想法。
為什麼我會想要做這些事情?我自己開始寫程式是1989年的事情,當時我8歲。
既然司法院也是逐字稿,立法院也是逐字稿,為什麼國教院不能是逐字稿?這是我的基本想法。經過三次討論以後,也很感謝20位出席的委員全部同意,所以從今天開始如果各位到archive.tw的話,就可以看到之前三次跟之後所有的國教院的逐字稿。
其實g0v本來另外就有一個專案,就是零時政府立法院,ly.g0v.tw就可以到零時政府的立法院,它顯示的東西跟這邊的政府是一樣的,只是說比較視覺化,比較容易,每一個法條好像購物車:到什麼程度,甚至它給的每個字,你可以把那個東西的超鏈結分享出來,我們就可以就法案的修正做討論。
剛才有聽到我在課發會剛擔任委員,開了三次會。我主要做的事情就是希望能夠建立一個系統,把所有課發會每個人講的話,還有照片都公開,這樣的話每個人每個時候講了什麼話可以成功地呈現在全民的面前。
我的第二個部分,就是Data Governance,會講到跟臺灣的國發會合作。
Socialtext,就是我2013年賣掉的那個公司,是把Facebook試著賣到各大政府和各大企業裡面。萌典是g0v的,我待會兒介紹,目前正在跟牛津大學合作。
誰也不能命令誰,也不是通過金錢交換的方式,每個人自願地去填坑,用這樣的方式就可以跟公部門、私部門有各種不同程度的合作。以私部門而言,我這5年來在跟蘋果合作做Siri的案子,所以看到資料的時候腦裡想到的都不是數字,都是文字,因為其實我們處理的東西全部都是自然語言,而且是雙向的東西。
我是1994年出社會的,工作了20年,2013年退休了,退休之後就沒事做,跟一般退休人士一樣做志願性質的事情。我退休之後才發現,臺灣的第三部門有別於由上而下各個科層的公部門,跟以市場機制為交換的私部門,每個人自動自發願意捐一點時間、捐一點力氣出來,這種志願部門非常強大。
我們在這裡黑客松的時候,通常都會用三個關鍵字來介紹自己:開源、公民、黑客。開源的意思是部分或者全部地拋棄掉著作權讓其他人利用,公民的意思是關心這個社會,黑客的意思就是用有創造力的方式解決問題(當然不一定是不合法的)。
第一部分的主題要討論的就是Crowdsoursing(眾包),怎麼樣說服許許多多的人,一起來願意提供資料,讓後續的利用者使用?
先請大家想一想,『資料開放:被動開放』跟『開放資料:主動開放資料』是兩件不同的事情。
但是你如果把它調換起來,一開始請使用者說做這件事情就是為了要累積資料,就是為了要把資料開放出來,這樣你就完全沒有後續利用的問題,這叫做主動公開。
所謂的『開放^資料』,很多人是想先取得資料,這些資料本來不是為了開放而取得的,它是目的外之利用,然後政府再把它開放出來,可是這樣就有很多問題,包含個資的問題、目的外之利用的問題,當初被搜集的人其實不一定為了取樣,他們也不一定是主動的,你也許還要取得他們的同意,等等。
這是最近發生的一個例子,我們國家教育研究院課程發展委員會,我現在是課發會的委員,我們開會的時候聽到吳部長說『學生要求會上的發言都被公開,這樣委員就沒有辦法放心』,在他講這句話的時候我正在會場跟其他委員說把『被』字去掉,主動公開,大家就可以放心了。
當時昇瑋要我講的時候,本來是『開放×資料』,各位議程上還可以看到,我後來想一想,乘法左右兩邊對調是一樣的,但是資料開放跟開放資料是完全不一樣的兩個概念,所以就換成了『開放^資料』。
今天的演講結構大概是這樣,我會分兩個部分,一個部分講Open Data ,另一個部分講Data Governance,兩個部分加起來大概講35分鐘,最多40分鐘,最後留10分鐘左右的時間問答。我的演講一般來講都會被認為講得特別快,所以如果有聽不清楚或者想討論的也歡迎隨時打斷我,然後我們就講的內容去討論。
謝謝彭會長達人的介紹。
雙引號跟單引號混合使用,是不是有特殊用意?
逐字紀錄已經做成,草稿今天就會提供。
以上發言、提案及相關資料是否都列入記錄?
呼應陳委員,看到第17頁,第四階段是第五階段內容的前面一部份。
所以如果第一至第三階段,直接沿用第四階段的Ca-IV-1、Cb-IV-1、Cc-IV-1,是否可行?我剛剛看了一下教學內容,好像並沒有非常衝突。
確認一下,就是在網路論壇一開始的時候,國語文領綱草案還不會完成審查?
第四版是完成審查後再放在網路論壇上?或是並行?
作為工程師,我也順便補充一下:「中位數」跟「算數平均數」是不一樣的概念。(笑)
真的非常熱情!
最後面一點,是關於保險在本地如何處理,第二個是否是真的自住房子出租。
我自己因為這次會議,最近第一次試用 Airbnb。
確實我的房東在平台上有七間不同的房子,好像不太可能都是自用住宅...
最後這句比較是宣示性質...(笑)
關於是否在台灣有固定的營業場所,請Airbnb簡單回應一下。
剛才講到有關於賦稅部分,不曉得經濟部及財政部的朋友有沒有要先回應的?之後再開放所有的朋友發言。
好的。接下來請Airbnb回應。
所以這樣說來,民宿算是營業行為?