六都在DIGI+裡面,每個都要認領他們附近的非六都縣市。
如果真的沒有問題的話,在下一次上層推動小組開會的時候,就會解除管考,這是跟地方協作的具體做法。
當郭執秘知道一件事的存在和重要性之後,他會回去科技會報,也就是DIGI+的協調分組。協調分組在這邊,並不只是每半年或每三個月一期的管考,而是直接跟中央、地方開會,然後盡可能把這件事解決掉。在解決之後,也會提回到當初所提出分組的副執行秘書,請這諮詢委員進來,來確認這個地方真的有協調掉。
當數位國家分組發現這個議題的時候,是可以透過民間諮詢委員對這一件事的提醒,到上面的推動小組,讓六都副市長知道存在這一件事,並且希望在下一次數位國家聚會時列入管考,或用某種方式向科技會報辦公室的執行秘書,對這件事進行報告。
這個編列的架構,跟之前NICI的架構,有一個非常大的不同,也就是六都的副首長是DIGI+上層推動小組的委員。在每個具體的分組裡面,好比像高嘉良講到的事情,它可能比較屬於數位國家分組,包含智慧城鄉、數位政府,乃至於網路社會這些事情。當然這件事比較不需要做資安判斷,但是如果有資安判斷的話,院資安處也是要進來的。
這兩件不完全重疊的事情,在行政院級會有一個推動小組,接下來在四個不同的單位會負責四個推動的分組,另外還有一個民間諮詢委員會,民間諮詢委員會的召集人會上升到上面的推動小組,但是副執行秘書會去管底下這四個的建設分組。
有的。目前處理的方法,是在「數位國家・創新經濟」方案裡。
我是協助督導資管處,但我一般不會微距管理(micro-manage)到這個程度。但如果他們中間碰到任何問題,都可以來找我幫忙。
當然啊!我的意思是說,其實人工抽查一段時間之後,某些試誤規則(heuristics)其實可以寫成半自動化的程式。一定沒有問題的就放過,看起來有問題的用人工複查,這都是屬於資管處的權限。
是,至少抽查結果的柱狀圖一定是人工做的。
是有抽查。
因此,跟各位朋友在這邊說一聲:我們絕對沒有要把資料下架的意思,只是提醒說你的反查是有問題的。好比說欄位是寫西元年,但資料值用了民國年等等的狀況,這是要一視同仁看待。並不是OID對不上,我們就特別看待,而是說如果寫西元年,但是用民國年,或者是反過來的情況話,我們就是在資料檢核機制裡面,如果有人反應的話限期七天回應,用這種方式去責成處理。
這件事,其實本來國發會就有對「資料欄位不符合資料實際內容」這件事加以檢查,而且檢查下來,我如果沒有記錯的話,初步抽查高達65%的資料集有這樣的問題,因此我們剛才開會的時候才討論說,如果一發現有問題就要下架的話,「data.gov.tw」就會瞬間下降35%的資料量。
但如果我們實際進去清點,發現反查失敗了,例如像把臺灣的「臺」寫成台灣的「台」的話,這就是屬於資料品質不良的部分。
這時,我們其實可以用一個宣示性的方式,去希望只要任何地方用unique key作為primary key,又能夠透過某個開放資料集,往OID完全對應,那麼在開放資料產製的時候就應該要反查OID的欄位,然後一併釋出。
另外你剛剛提到比較大的,有時在系統建置的時候,只用機關的全名,而不用OID當作主要索引(primary key)。或者是用OID,但並不是在全部的地方使用OID,而是用和它關連的某個特定索引(unique key)。
好比像服務對象,如果想要求每個機關都填報其服務對象,這件事應該是回到OID資料庫的維護來做。如果維護另外一個關連式資料集,從OID到服務對象,我想這是比較疊床架屋的做法,最好還是要回到OID的基本資料集。
當然,如果這一個OID編得不夠細,或者是裡面的資料欄位有缺,我們應該是回「data.gov.tw」的標準程序,希望把OID相關資料加以擴充,加上OID所連到的描述性資料,這個是爭議性最小的。
對,不需要用eGov login,你可以直接去「data.gov.tw」裡面拿。
我想首先就是說,在機關的認定、設立上,本來就會有一個OID的編制,這個是由國發會資管處維護,有一個類似於LDAP、不斷更新OID的資料庫。這個資料庫裡面,本來就設立地方、地址、主要聯絡入,所有這些基本資料都在那裡,而且我沒有記錯的話,是公開可得資料。
好,這是非常好的問題。
工程會。
對我來講,最後只要進入「data.gov」,就是一樣意思的東西。具體哪一個部會阻力最小,我們就從阻力最小的那部會去取得。請繼續。
這三套資料同時提供,這個需求是可以去談的。
是。我想我這邊具體可以做的一件事是,除了用三欄之外,也許我可以跟他們說不只是三欄,而是本來的全部、後來的全部及修正的三欄。
有啊!會三欄的。
為什麼要這樣做?因為我們想要把裡面每項公告時的文件,全部都轉成結構化資料,來放進公共參與平台裡面的「眾開講」這區裡面,每天會上十個、二十個這一種公告進去,這中間的界接,當然是透過開放資料。
另外一個是,並沒有一個有系統的方式,把它加上一個部會的標籤,然後去界接到一般人民可得的開放資料集裡面。這一個工作,我們具體會在明年大概2月的時候,透過行政院國發會開放資料平台,把這上面所有這些看到的資料,都轉換成「data.gov」上的開放資料集。
所以現在的問題有兩個:一個是使用PDF格式,它的結構性可能有待加強,但至少不是圖形檔,我們目前看到的通常都是文字檔。
這個資料屬於公報資料,所以是不可能主張著作權的東西。
所以當他最後通過,也就是六十天過了以後,它會有一個「自即日生效」的PDF在這邊出現,但是在這個生效的時候,你回推六十天,還會看到另外一個公告、預告修正的同樣一個格式、名稱的東西在這裡,所以從前六十天前的跟六十天後的這兩個部分,在這裡一定有資料的。
在我上任之前,9月的時候,行政院本來就已經把所有的法規修正的預告期間,從十四天改成六十天。
對。
這個時候就要看沒有人知道的系統。我們不斷給大家看沒有人知道的系統...
其實這個是有的。
修訂紀錄在我剛剛展示的那個API裡是有的,應該是去另外一個系統拿,像是立法院議案文書。
在資料格式這一部分是沒有問題的,但在授權裡面,是不是一下子就要全部開放到CC BY的寬容式授權?這在各國都還有爭議。我們在中央各部會裡面,目前並沒有形成非常統一的見解。
當然「相同方式分享」跟「禁止商業利用」又不一樣,但也有人說希望禁止商業利用。也就是說,本來CC授權架構裡面,就包含了對資料六種不同的想像。
以法國為例,他們所適用的授權會兩個併行,想要鼓勵產業的才會去用寬容式授權,如果不是想要鼓勵產業的就會加以限制,限制條款裡面就包含比較像「相同方式分享」的東西,如果拿它做了應用、對資料的改做,跟它相混合的資料也必須都要用相同方式分享,也是有這樣一派的想法存在。
但其實在國際上,對於資料的授權,是有完全不同想法的流派存在。目前所通過的國家資料的授權條款,它是屬於寬容式授權(permissive license)。這個意思是,你既可以做社會上的運用,也可以做商業上的利用。
不管是國際上政府對政府,或是任何國際的協約,要作資料交換,都是這樣子做。
「以兩個以上開放源碼軟體可以讀取的格式」,這是國際上對於開放格式的定義。這一個定義我們已經有政治意志,可以說所有的機關之間互相界接,應該要不用專屬軟體就可以開啟,而且必須要機器可讀、可以處理,這部分是沒有問題的。
我必須跟各位朋友做個期待管理。
以上只是舉例,我並沒有要介入個案的意思。
在提出一個恰當能回應社會問題理由的時候,我們就可以用那一個理由,專案去跟法務部討論,這也沒有問題。
但是我覺得,除了用正規開放資料諮詢小組的程序之外,就回到我們剛才說「資料是要為開放政府服務」。如果從民間的角度,能夠去看說現在有某顆未爆彈或某顆地雷,需要有這樣子開放授權的東西,我們才能把法務部的草案,好比說是關於民法家屬的部分,用機器自動做成懶人包...(註:這只是舉例而已)。
當然我們現在也理解,未來不一定三個月開一次,說不定半年才開一次,我們剛剛才講過這件事。因此處理的週期比起以前長,可能沒有辦法用一種隨時檢討的方式來處理。
應該這樣子講。我們剛剛才開過的院級開放資料諮詢小組會議,仍然可以建請特定部會在他們的開放資料諮詢小組裡面,去討論這個事項。
當然,廠商必然還是會有廠商提出的要求,只是至少從完全不懂資料格式的高層管理人員來看,至少這是兩個可以相提並論的東西,並不是一邊是空想,另一邊是現有的系統。
現在的做法程序,仍然是承續我們在g0v的做法。如果我們已經可以證明用這個API,可以提供跟這個相等程度的服務,為什麼機關下一次改版或重新採購的時候,不用這個方式來具體釋出?這個方向跟路線,與我們以前在g0v是一樣的。