• 不好意思,遲到 2 分鐘,我們開始吧!就把主席致詞的時間還回去,我們就直接進入辦理的情形。

  • 因為有新任的委員,所以是不是辦理情形之前,新任的委員先跟大家自我介紹一下,或者是有什麼想要倡議的,都可以先在這個環節先做。我們就從何委員開始。

  • 主席、高副主委、各位委員、各機關主管大家好,很高興有這個機會來擔任行政院資料諮詢小組的委員,這個工作是一個非常重要的工作,也推動好幾年,我記得從一開始的時候,我們是要求各部會提出五個部會資料集,到目前為止已經有好幾個,所以這個工作對我們政府數位轉型、公民參與,還有對於新創資料的應用,都有相當的意義。

  • 未來數位發展部成立以後,這整個資料開放、大數據的應用、創新與支應民間產業發展與國際連結,應該是非常重要的工作,再次感謝院裡面的主辦單位、國發會有這個機會可以參與這樣的工作,謝謝。

  • 謝謝何委員。請朱委員。

  • 主席、高副主委、在座各位,大家好,我叫朱斌妤,目前任教於政大公行系,很高興有這樣的機會可以來參加這樣的會議,希望可以跟大家多學習,謝謝。

  • 主席、高副主委,大家好,我今天是第二年在這邊服務,著作權或者是開放資料本身投入比較多,所以也希望在這一方面繼續跟大家往前進,謝謝。

  • 大家好,第一次參與這個會議,我是劉嘉凱,之前也有參與過其他的部會的開放資料諮詢會議,我經常處理的是資料治理議題,希望跟大家多交流,謝謝。

  • 政委、副主委好,以前參加這個會議是在政府部門端,第一次以委員的身分參加,不過現在還是一樣關切政府資料治理,當然政府資料治理要先做好,跟民間、產業流通才會更加順暢,這是一個很好的平台,跟大家一起探討,謝謝。

  • 謝謝。高副主委要不要分享?

  • 政委、各位委員大家好,我會擔任這個委員主要是因為資管處是資料開放小組的幕僚單位,不過我覺得非常忐忑,因為其實我們過去一年,在資料開放與治理這一塊繼續推由下而上,但是畢竟主動、積極的作為比較少,今天討論的第一個案子,我們一年前想要推,也就是希望由上而下,不是由下而上,不是由下而上,因為由下而上都是自願,但沒有具體的進展,因此我們會期望到時若政委擔任數發部部長的時候,這一塊可以有很大的著力,因為將來畢竟是資料驅動的時代,我先表示慚愧,然後再非常興奮與期許未來數發部的著力。

  • 謝謝。我們就之前的列管題目先說明確認一下?

  • 不好意思,我們還有金管會的同仁。

  • 謝謝政委、高副主委,我代表金管會來參加會議,非常高興被政委選中,因為在金管會的部分,我們內部也有資料開放諮詢小組的組成,我本人在金管會當中是擔任主席,所以有七位的民間代表、十位的機關代表,每年就前一年度會對明年開放的資料有哪一些、要達到什麼目標,每一年都會設定目標。

  • 現在我們已經開放了 1,581 個資料集,今年的目標我們也會從資料開放的指標當中,今年預計開放有 1,600 個,因為整個金融相關的資訊、周邊單位的相關工作,所以我們也希望儘量可以開放,一方面民眾可以有新的資訊,二方面是這些資訊可以再利用,可以有新的商業模式,因此金管會未來會在政委的領導之下,繼續往資料開放的品質與數量繼續努力,謝謝。

  • 謝謝。之前總統盃黑客松印象很深刻的是,金管會是主動做課予這些業者義務的法規文字,不是完全數字資料,而是整個文字結構化的資料,讓新通過什麼規則的時候,讓國泰可以直接轉譯成對客戶的系統,等於是自動法遵,這是滿先進的,也很給其他部會參考。我們就進入列管事項。

  • 主席、各位長官大家好,以下報告歷次會議事項的列管情形,本次有一個會議列管事項,是 109 年第一次會議的決議:第一,請科技部調整 GRB 系統規劃,提供政府機關可自行選擇資料開放授權方式。第二,請科技部研議修正「政府科學技術研究研究發展成果歸屬及運用辦法」之可行性,並於下次會議報告說明。請科技部報告。

  • 主席、各位委員、各位與會先進大家好,科技部這邊針對上次的列管事項跟各位報告:

  • 第一件,GRB 已經參考創用 CC 的部分,新增資料開放授權的選項功能,目前已經開放讓各個計畫主持人可以登錄系統之後自行提供資料,並且選擇授權的項目與方式。

  • 第二件,有關於修正「政府科學技術研究發展成果歸屬及運用辦法」之可行性部分,經過評估目前是沒有修法的必要,建議是採法規解釋的方式說明法條適用的情形,供各機關援用。這部分在上次的會議後,我們有跟主席報告,並且在同年 12 月 29 日有發布解釋令,以上科技部報告,謝謝。

  • 謝謝。這個解釋令,我記得當時是在我們這邊做出這樣的調整之後,由部長發的,但那時好像 GRB 還沒有完成調整,對不對?GRB 是什麼時候完成調整的?

  • 跟主席報告,GRB 是今年,我們調整完,開放這個功能,讓計畫可以上傳資料。

  • 我的意思是,因為我如果是一個計畫主持人,我之前接到這個函,我不會立刻知道 GRB 這個功能已經上線了,或者是你們上線以後,有用類似什麼方法讓大家知道?

  • 之前跟各計畫單位有討論過,單位是以我們部裡面來說,建議採試行的方式,也就是我們挑選試行的計畫,讓試行計畫的計畫主持人先測試,覺得 OK 之後看後續怎麼做,因為涉及到後續包括像之前會裡面也有提到在各個計畫,要請他們把資料上傳或是開放授權的時候需要有一些前提,像一些約定這樣子,所以我們目前是用試行的方式先看看效果怎麼樣,然後再作後面的推廣。

  • 所以意思是試行的時候,不會主動讓其他人知道有這樣的功能存在?或者是他們到介面上自動就會看到了?

  • 如果他們上傳資料的話,基本上就看得到。

  • 瞭解,想問大家有沒有什麼想法或者是意見?在講 GRB 裡面「可重現研究」的部分。CK。

  • 如果我是計畫主持人,我完全沒有誘因要加入,所以這樣的方法,我覺得會很累,進展很緩慢,所以一個建議也不會違背人家自由意志、不強迫別人的話,就是做統計,GRB 有 1,000 個,每年就統計每個學門、學校或者是每個單位,目前加入的有幾筆,良性競爭的方法來慢慢改變氛圍。

  • 之前國發會有徵詢各部會的推廣方式,好像也有提到類似的,有點像 peer pressure 的概念,要不然我們先聽一輪好了,看志宏老師有沒有要提?林委員。

  • 有關於 GRB 的部分,因為我們自己也執行計畫,所以大概可以從主持人的角度稍微來看 RGB 的這件事,我很認同嘉凱這邊所說的;第二,多數學術單位的主持人,對於創用 CC 跟不同的權利,對於他們自己開放的這件事會有什麼差別,其實是陌生的,所以我想正常來說,大家看到一個東西,應該不太可能會選一個不瞭解的,因此如何把這些不同的權利,會如何影響他們上傳之後,後面對於他們所發表的,會造成什麼後續的影響,如何讓大家知道,這是第一點。

  • 第二,在授權的時候,到底現在授權的是,也就是計畫成果的部分,或是將他們的 open dataset 放出來,這裡面其實再拆解開會有兩個層面,如果不交代清楚的話,其實計畫主持人會擔心的是,現在要看我的報告,我的報告不是都有繳交給科技部了嗎?如果現在要我的資料集,有些資料集可能還會做其他的利用,我一定要交出來嗎?可能會引起一些學界對於這一方面議題,可能因為不瞭解或者是模糊而產生的一些衝突,這也不是我們的用意。

  • 所以推創用 CC,我個人也在推動 CC,所以我是非常支持的,但這整個過程還是需要大家互相透明與瞭解的地方,根據方才所講的那些部分,看看怎麼樣研議,讓細節能夠再更明確一點,以上。

  • 謝謝。所以委員提醒我們兩個:第一個是要有很明確的指引,讓他知道點這個的時候到底會發生什麼事,要有比較清楚的交代;第二個,不要讓人覺得很像非常 top down,從頭到尾不管是試辦前、中、後,不要很像本來那一套做法好像被破壞的感覺。

  • 是不是可以先請國發會把其他部會對題目的意見,也稍微讓我們知道一下。

  • 主席、各位委員大家好,接下來補充報告部會對促進科研計畫資料開放及再利用的建議,首先報告我國目前科研成果及科研資料在我國的現況。科研成果意指成果報告或出版品,目前我國已訂有政府科學技術研究發展成果歸屬及運用辦法之明文規範,對於科研成果的相關歸屬管理及運用都訂有相關規定。且科研成果是透過 GRB 來作為主要的公開途徑。

  • 科研資料的部分是指我們在科研計畫執行過程中的研究資料,包含統計資料、量測結果與實驗數據等,目前我國未有明文規範,主要是採自主管理。

  • 檢視目前先進國家,如歐盟、美、日的作法,科研成果是以公開為原則,並沒有強制開放,科研資料是採取有條件的開放。目前我國跟國際上的差距,主要是在於促進科研資料交付及開放的作法。

  • 為推動我國開放科學,109 年 11 月院諮詢小組決議已請科技部進行短、中、長期之規劃,本會於 110 年 8 月也邀請科技部及相關部會召開研商會議,會議共識尊重科技部的看法,就是在推動開放科學仍應兼顧著作權、專利權與機敏資料的保護,同時就科研成果,宜約定可公開的計畫,鼓勵資助機關跟研發單位進一步約定科研資料的開放項目與範圍。依據上述研商會議共識,本會後續函請相關的部會提供相關的意見,部會建議在等會簡報會進行說明。另立委王婉諭辦公室也非常關心開放科學的議題,因此在去年 10 月也邀請科技部與本會召開協調會議,請科技部積極研議 GRB 開放授權選項功能上線,並且請科技部就開放科學、科研資料開放政策進行發展上的指導研究。

  • 基於上述發展歷程與會議共識,彙整四點部會的建議:

  • 建議一,推動原則,也就是建議科研成果得公開者,宜以契約約定「科研資料」以開放資料提供為原則,這部分因科研計畫的範圍特別廣泛,因此農委會建議可先以特定範圍來試辦,檢視推動的成果,再行研議共通性的做法。

  • 建議二,補助要點相關規定或契約增列資料授權使用條款,建議科研資料若可以公開,宜約定科研資料,以行政院指定的開放資料授權條款來提供,當然也考量到科研計畫本身可能有一些特殊屬性,所以也允許科研計畫可有條件的授權,就是另透過資料使用協定約定授權第三人可以使用的條件與範圍。

  • 建議三,明確科研資料的交付範圍,這部分是建議資助機關應於契約約定交付之科研成果應確實包含相關科研資料,因目前部會對於科研成果所應涵蓋的資料範圍尚不明確,農委會、衛福部建議科技部可更具體定義科研資料的類型。此外,原能會建議可以明確限制開辦索取幾年內科研資料。

  • 建議四,完善科研計畫之資料管理機制,建議資助機關於契約要求執行單位訂定並交付資料管理計畫,來落實及確保資料管理的品質,讓第三方得知一些使用資料的可能性與條件。

  • 後續推動部分,因科技部是我國科學發展的主管機關,上述所提相關部會建議,再請科技部後續進一步參考規劃,以上報告,謝謝。

  • 謝謝,我想建議一、二的部分,是在我們本來的列管範圍內,應該都研議到一個程度了,剛才科技部也有說具體試辦。建議三、四比較像接下來還可以做的事,也包含剛才嘉凱所提到的,也就是至少每個不同的學門也好,或是不同的主管機關投入也好之目前資料集狀態,當然這個也有我們很早推動開放資料時的資料集問題,但無論如何總是一個開始。

  • 剛才組員也有提到我們是不是要把科研資料有別於成果,也就是有哪一些類型跟影響力等等,有一些輔助性的說明,就是讓計畫主持人或者是 GRB 的使用者知道,所以先繞著建議三、四,看看有沒有幾位委員要先提出來的,讓科技部可以統一回答的。

  • 我想就科研資料的定義跟形式,的確需要科技部這邊協同主要相關的科技計畫,然後再進一步擬訂,因為 GRB 報告的部分,的確是科研資料的一小部分,很多部分可能是在這些 GRB 報告附屬資料或者是檔案,直接存在雲端或是電腦當中的 dataset,至於這個檔案要如何整理、整理到什麼格式才符合公開,簡單來講,如果不是機器可讀,你號稱公開或者是裡面的格式也沒有定義明確,別人看到這些檔案,幾乎很難使用,所以科研資料,特別 dataset 的形式與格式有一些細部的要求,可能還要進一步研議。

  • 第二個部分,回到科研計畫本身,因為科研計畫非常多種,有的科研計畫涉及的研究議題某些資料有敏感性,我舉例來說比如像水文資料,水文資料蒐集到某個程度,其實跟我們的港口、國防安全有關係了,有人提過水文會涉及到海防。

  • 有的資料當初界定就公開的,像綱要計畫的層次或是當初跟政府申請經費的時候,也就是標榜這個資料是要公開的,因此每個計畫當時執行目的的不同,建議依照目的不同來建立資料管理機制,如果原來就以資料開放為目的推動的,或者以資料公開為特色作為主要效益的相關計畫,像後面相關的條款與契約,恐怕就不是「宜」或是「建議」、「鼓勵」而已,應該是強制要求。

  • 最後一點,我提一下鼓勵的條款,我建議科技部跟相關部會可以再稍微研究、蒐集一下,因為我記得參與的案子,我們有執行的 PI,我們的同仁回來跟我們報告他刻意有些 dataset 是對國際 open,當然沒有個資的問題,自己資料過的 dataset,自己的親身經歷是那幾個 paper,在國際上引述地特別亮麗,也就是當資料公開,然後在國際上符合國際趨勢,在國際上引起注意的話,我們相關的學術研究影響力是可以提高的,但我們在實施這整個措施的時候,不應該只是由上而下強制要求,科研團隊搞不好會覺得這是被要求的義務,他覺得不受到任何的鼓勵,但另外一個,如果我們引述相關的案例,讓他們知道 open 會讓他的科研成果的國際影響力提高,有一些明確的佐證或者是一些機制讓他們知道,說不定有很多工作團隊很樂於讓他們執行的計畫,以上。

  • 所以有兩個點:

  • 第一,可能契約要求的「宜」,感覺是判斷的意思,但是應該是「先」,絕對不可以公開的,也就是大家都不要知道的比較好,像國防、營業秘密等等,也就是怕別人不知道的,這兩個先分開。分開之後的強度,一邊是可以更強、另外一邊是不應該要求。

  • 第二個,第三方使用之可能性與條件,感覺是比較硬的,所以因此 citation 變多了,在學術界的聲望比較變好等等的軟案例來激勵大家,這個來說服力會比較高。

  • 我記得我執行科技部計畫,其實以前都是鼓勵老師一定要上傳,像我們做社會科學的一些調查,我們就很乖乖的資料上傳到中研院,我記得最近的計畫也被要求,用的語氣並不是我可以選擇的,而是「必要」、「一定」,所以還要就教科技部,我是「宜公開」或者是「應公開」。

  • 我的建議是附和蔡委員,也就是負面表列是不是可以表列完畢,我覺得這個可能科技部必須要研議得非常清楚。

  • 第二個,我想要特別強調的是,我個人都是鼓勵公開,但我們在社會科學的一些調查,有一些老師擔心若公開的話,paper 還沒有寫完,就被人家拿去寫 paper,因此不同領域在做這樣的思考時,常常又會很大爭議,因此如何在這邊可以達到好的拿捏,是不是可以擬訂得更清楚。

  • 第三,像我鼓勵公開,但是對於我在計畫當中,對於我的要求、可以給我們支持,我可能比較慚愧,沒有很認真 follow,還沒有鼓勵到所有的老師知道後面還有一些利益,因為社會科學有一些調查,面對人蒐集的資料可能會有一些困難度,老師們的要求會比較高。

  • 最後一個,我們在做資料的事情,尤其像社會科學,像醫療也有,也就是在 IRB 上,如何跟 IRB 上的學校輔導單位能夠有比較好的密切配合,我想是不是科技部這邊應該有更多的輔導或者是規範,謝謝。

  • 謝謝。我想後面這邊很重要,就算主張這只是統計,但是其實到底中間用的那些隱私科技之防火強度多少,會不小心洩漏,我想這個跟我們在推政府開放資料公務員擔心是相同的,所以我覺得這部分也有一些經驗可以給科技部參考。

  • 在執行面,我想公開是 ok 的,但將來在執行的時候,要研究有沒有什麼樣的機制來跟這些研究計畫主持人,也就是考慮一個資料是不是可以公開,可能沒有辦法單純從計畫本身的觀點來看這個議題,因為像剛剛蔡委員所談的,有很多不同的各自覺得可以公開,但是湊起來可能就是一個敏感資料,所以跨計畫之間的公開資料,將來如何判斷,可能也必須要注意的。

  • 像剛剛在執行的時候,大家討論比較多的,像犯罪資料,還有將來比方像經濟部地質資料的探勘等等,如果把很多不同的資料公開加起來會有其敏感度,因此在執行面的時候,如何有這樣的機制來處理這樣的議題,可能也必須要探討,謝謝。

  • 所以一方面當然剛剛也有提到,時間稍微延遲一下,我們多一些時間檢視 OK 再公開,再來是資料再連結、識別,所以必須要全盤來看,這幾塊拼圖公開最後一塊是什麼,但是事實上可以拼湊出來個資,謝謝,這是非常好的提醒。

  • 所以不曉得不管是教育、經濟、財政、交通、金管會、法務部的同仁有沒有要在這個題目上提醒我們的?不管是作為科研出錢機關的角色,或者是作為研究者的角色?

  • 我們會提出這個建議,最重要的是因為大部分都是科研成果、並不是過程當中的資料,其實很多國家會要求科研資料,因為政府是出錢的人,所以剛剛講到鼓勵,某個程度還有義務,尤其是歐盟是百分之百出資的,因為現在只是成果,但是中間的資料才是真正有用的。

  • 我不知道就科技部來說,目前計畫當中,我們跟所謂的研究者,當然要公布的時候,我們目前是不是用契約的方式來約定,是不是有什麼各部會應該遵循一致的準則?其實各部會建議當中,講到很多到底哪一些東西一定要強制有規範一定要開放、期間是多少,及這個資料是不是要有完備的管理機制等等,其實我們可以看到,像各國的 open science 都是在指引當中規範,將來畢竟科技計畫最多,可以作指引,像科技計畫在做委辦計畫的時候,是不是有一個簽約的規範,蒐集到這些資料的時候,是不是有一個完整管理的體系等等,我覺得很多國家在這個地方其實都有一套非常非常完整的機制,讓想要做這個事情,各部會有一個遵循的罰則,所以我才會覺得各部會推這四個建議當中,其實基本上在講述這個問題,我的感覺不知道現在進行到什麼程度,也就是這個機制在臺灣,科研資料這一塊已經有什麼樣的處理,哪一些地方需要補強的。

  • 是不是就請科技部綜合回應一下,剛剛這些建議當中,哪一些聽起來像接下來半年、一年看起來可以做的方向,哪一些是目前其實已經做的,也可以讓我們知道。

  • 謝謝各位委員剛剛給這麼多精闢的指導,也謝謝國發會整理這份簡報。科技部整理一下,也跟各位委員、長官報告一下現在的狀況:

  • 第一,我們現在 GRB 上,請各個計畫一定要繳交公開科研成果的部分,也就是科研成果包括過去如果認定是機敏性、不適合公開的話,就不用繳交,但是我們也希望做一些突破,所以我們在規定上有請相關專案的補助計畫,在執行成果的部分,如果有在專利上或是有其他剛剛說要升等或是要發表 paper 考量的話,我們會請他們把屬於機敏性的部分遮掉,然後把可以公開的部分,可以作簡短的資料上傳,這是研究成果的部分。

  • 另外,剛剛也有提到科研資料的部分,過去其實科研資料都是在各個計畫執行團隊的手上,因為屬於中間過程機敏性的資料,我們之前有研究過各國的執行方式,在科研資料的部分,其實並沒有強制他們一定要公開甚至授權,因此我們其實已經著手一段時間,但是在執行上,就像剛剛委員提醒,其實還有很多層面的考量。

  • 除了國發會整理關於有一些提醒,像建議二當中有提到如果防火巷的專利要排除之外,其實科技部也認為因為最近其實美、歐、日、韓、澳的這些國家,其實針對國際間科技產業的競爭,其實都有修法,要強化科技的保護。因此在科研資料的開放,就像剛剛委員所提醒的,有一些計畫資料拼湊起來變成機敏性資料這件事情,我們認為剛剛那些要考慮的部分之外,也要考量到後續產業跟國家間科技競爭的議題。

  • 像剛剛委員有提到,在科研資料上,雖然科技部協助科技預算方面的審查,但其實各機關資助的計畫非常多元,實際執行上都在資助機關的權管上,因為科研資料是不是適合開放、希望開放的範圍,其實是屬於各個機關比較瞭解、知道的,因此我們也建議是不是可以參考之前農委會的建議,由各部會這邊先決定他們自己在負責的範圍裡面比較適合的範圍來試辦,因為現在包括像適合公開的範圍、期限的部分,其實相信各部會目前都還沒有定見,因此我們建議等到各個資助機關能夠檢視評估開放的科研計畫範疇之後,我們再作比較完整的整體性評估與規劃,以上報告,謝謝。

  • 所以你們想像的期程會是多久?

  • 跟主席報告,以科技部試辦的計畫來說,現在有一支計畫試辦是 PM2.5,其實累積 106 年至 109 年的資料,所以這件計畫以我們單支計畫執行,都是以一年為期限,一年執行完之後,我們可能才會收到評估可以上傳資料的狀況。

  • 所以就是在接下來一年,也就是到明年 6、7 月,如果我們按照嘉凱的建議做了統計區的話,目前在沒有別的誘因情況之下,上面真的會有勾的資料嗎?以目前的判斷。

  • 其實我們還不知道其他部會的意願,但如果就科技部的部分我們很積極在做,我們有選一些比較適合的,如果要求他們上傳資料比較不會有爭議性的計畫在試行,因為這個部分跟他們簽訂的補助契約並沒有提到這件事,我們之前試辦是之前已經確定可以公開的東西,後面 110 年,我們也已經開始執行了,幾支計畫其實已經在合約當中,有跟計畫主持人溝通,如果順利的話,我們在今年底或是明年初可以看到資料的狀況。

  • 剛才朱委員所提到的,感覺上比較有一些比較強的文字,這屬於個別學門嗎?我不確定這個是哪一個的部分?

  • 那個部分是現在科技部補助計畫時合約裡面已經有這樣的調整了,所以委員提到有一些提醒,希望他們可以把一些科研的成果要上傳,然後遮蔽掉不方便公開的部分。

  • 這樣瞭解了。還有要補充嗎?

  • 告訴我們要上傳、遮蔽掉,但是後面要怎麼樣做,這個就⋯⋯如果有問題的話,誰要負責任?這個我們不清楚。另外一個剛剛科技部同仁在問,我有一點疑惑,像農委會、經濟部,有一些是用議題來分,或是農委會出資的科研計畫,是不是都由我來作規範?我現在不是很清楚知道這邊講的,也就是要各部會列出來,我不太懂這個邏輯要怎麼樣進行,我聽不是很清楚,謝謝。

  • 是要各個部會參考科技部的做法,自己界定 guideline,或者是那個部會推薦個案或者是幾支,然後由科技部來輔導,可以再說明一下嗎?

  • 恩跟委員跟主席報告,我們之前有想瞭解一下各部會計畫的規劃方向,但其實各個領域都不太一樣,像農委會就是在農業方面是他們的專業,不過像育種或比較屬於產業經驗的部分,這部分科技部並不會很清楚,那會是農委會比較專業的管轄。

  • 至於他們在培育的過程中,田間的一些資訊是否適合公開,或者是那個資訊公開的話,是不是會造成後面產業間後續的效益,這部分可能也是農委會試驗中心比較清楚,也比較瞭解產業方面的發展,同樣在經濟部也是有同樣的問題。

  • 因此我們建議像由農委會、經濟部可以在自己擅長的範圍當中,可以先釐清到底哪一個範圍比較適合來做這樣的試行。試行完之後還會做其他的評估,像剛剛提到的,比如產業、著作權或者是其他智慧財產權的評估之後,再來看他們的領域或者是部會所轄的計畫,適合哪一些計畫在源頭,請計畫主持人執行之前就先有準備,就可以把中間的過程資料讓大家分享。

  • 所以聽起來是科技部把自己的做法,作為一個沒有拘束力的範本提供給各個部會,然後看他們要怎麼樣變化應用,然後等大家都執行一年之後,再來看有沒有共同的,好像是這個意思。這樣有回答嗎?

  • 不過我有一個經驗稍微分享一下,因為我之前也有執行 SBIR 的成效,我記得那時有聽到同仁說,RFID 用在豬上,是屬於經濟部技術處的事,但那個是屬於農委會的,我只是舉這個例子,也就是科技的界限由部會自己框定,但是有時框到動物身上的時候就不知道什麼界限。

  • 理解。看各位委員還有沒有要提醒我們的?

  • 科技部的說明比較是決定科研計畫的哪一些資料要開放這件事,也就是哪一些屬於公開資料可以開放,但是我們講的是如果科技部作為科技計畫預算分配單位的話,跨部會間是不是有針對科技計畫當中,有一個一次性的指引來責成,如果有接受科技計畫資助的計畫必須要做科研資料開放的這件事。

  • 農委會為何這樣寫?意思是「你告訴我吧!我要怎麼樣做?」並不是農委會自己決定哪一些資料是可以 open 的,因為上位沒有決定的時候,下面當然知道哪一些東西要開放、哪一些不要開放,因此我覺得這個應該要做的是更上層,也就是各部會一致性的標準。

  • 我 follow 高副的意見,我剛剛想要提的也是上位政策方面,像剛剛有提到資料管理制度的這件事,其實老師對於研究資料的一些管理,目前各界的計畫當然有一些處理方法,但是如果我們今天考慮到是一個 open research dataset 的時候,我舉一樣是歐盟的例子,歐盟其實有一個是學術誠信的計畫(Research Integrity H 2020),在那個計畫當中就有提到資料管理政策方面,其實是在 Research Integrity,我們在臺灣的話,其實就翻譯成學術倫理或者是學術誠信。

  • 實際上目前在臺灣雖然開始有把 Horizon 2020 搬進來,但是在臺灣的學術誠信還沒有真正針對資料管理制度去建造制度,所以我自己會覺得如果我們要做這件事,其實應該是要同時進行的,而不需要再拆開來。

  • 我 follow 高副意見,其實歐盟那邊已經有很多我們可以 follow up 的訊息,如何讓我們資料管理的進度,能夠跟上 Research Integrity 的回覆。

  • 第二個,open dataset、research dataset 的部分,我們都知道可以分為量化的資料跟質化的資料,其實這兩種資料在釋出的時候,樣子很不一樣,像量化有大量的文本,質化還是以數量為主。

  • 但是多半的老師知道是拿 dataset,但是上面還有一個是 metadata description 的概念,因為每個老師對於資料的敏感度並不是那麼相同,所以我們今天要訂的到底是 metadata description,還是告訴他說趕快把資料附上來,因為當我們缺乏 metadata,其實就會出現剛剛嘉凱所提到的,也就是那個是什麼東西,其實不瞭解、也看不懂,以上,謝謝。

  • 理解。看大家有沒有意見?

  • 如果可以往上討論的話⋯⋯

  • 來啊!(笑)

  • 應該不只是談 GRB 資料的 open data,針對國發會期待的,有幾個做法可以從跨部會的角度思考,第一個是這些申請者主要是大學,教育部應該要進來,因為他們管大學,所以是不是大學評鑑、open science 推動也是列為加分項目,在初期,這樣就有配套,不然光聽到現在沒有任何的蘿蔔跟棍棒,所以政策推動會很累。

  • 再來是提供方法跟工具,國內像中研院有在做一些 data repository 的研究,就是 research data 的研究,國外也有所謂的 open science framework 的 open source 專案,協助研究者在做研究的過程中,研究筆記、內容、管理、版本控制與發布,又或者是資料集,有提供各個面向的工具,還有現有的資料儲存、分析工具的整合都有,進行系統性盤點,可能就可以從上面、下面建立一些不只法規的指引、政策指引,還可以有操作工具,還有剛剛林老師提到的說明,其實就知道這個東西對我有什麼好處,而不是增加我的負擔。

  • 謝謝。所以教育部的同仁,有要回應一下手上有什麼政策工具嗎?

  • 主席,不好意思,因為我們不是 open data 的主政單位,我們因為是第三個議題所以派員過來,這個部分我不方便代為回覆。

  • 謝謝。看大家有沒有其他要提醒的?

  • 如果沒有的話,可能具體分成三個部分,事實上請到第 2 頁,剛剛在講的都是右下角那一大塊空白的部分,雖然有一些橋接,好比像 metadata description 可以放 GRB,還有科技部的解釋令,其實裡面涵攝到科研資料的部分,但是因為各個部會並沒有很明確可以參照的 guideline,也很感謝科技部願意身先士卒,所以我想第一個部分是科技部現在這樣子自己試辦的方向,我覺得當然很好,這個要繼續。

  • 剛才委員們有很多關於 GRB 介面上,不管是可以去作一些具體良好案例的分享,或者至少讓他們知道有多少其他人在做這些事,或者就算是特別標明這個是科技部自己在用的資料管理架構,並不是硬要你用的意思,但是也可以放在上面,也就是手上一些比較事實性的東西,也許可以在 GRB 上面,除了科技部自己試辦之外,也可以提供,這個是第二個部分。

  • 第三個部分,這個比較像是政策工具,大家可以想一想,有沒有什麼剛剛講到的正面誘因或者是負面的一些激勵方式,讓大家覺得這個是大方向,不管是一年後、兩年後就會往這個方向做,一開始只是討論有這些事,並不是立刻全部都頒布下去,這個我想也是科技部可以開始思考的狀態。

  • 這三個看科技部是不是覺得可行?我想本來列管的已經做完,就會解列,所以會新的部分重新再啟一個事項。

  • 謝謝主席幫我們整理後續精進的方向,科技部這邊的試辦計畫還是會持續進行,我們會看試辦計畫的情況,然後再看看有沒有什麼要調整與精進的地方。

  • 再來,可能還是會看看有沒有其他部會願意一起加入試行的部分,然後才可以進一步協助與釐清不同領域的科研計畫,後續在科研資料如果要公開或者是進一步授權的話,哪一些資料是適合的,也許在這樣的執行狀況之下,可以再往下走;GRB 的部分我們會持續精進剛剛主席建議的部分。

  • 至少讓不是被選定試辦也有機會有這樣的一件事,也可以主動讓你們知道他有興趣要試辦,先這樣,謝謝。

  • 如果這樣 OK 的話,我們就往下。

  • 接下來由國發會報告,高應用價值主題推動規劃。

  • 主席、各位委員大家好,國發會就「高應用價值資料主題推動規劃」進行報告,首先報告政府資料開放的現況,目前政府資料開放平臺統計至今年 5 月底,資料集已達 5 萬 7,000 筆,其中有 83%符合金標章,跟去年同期相比使用人次也成長 21%,而每年辦理的獎勵活動也帶動機關形塑許多公私協力應用之示範案例。

  • 目前政府資料開放平臺質量已有一定成效,下一個階段將聚焦高應用價值資料的應用發展,推動目的是希望透過公共參與、諮詢小組機制推動機關加速釋出高應用價值資料,也希望透過高應用價值資料的發展,來活絡民間發想資料創新應用。

  • 有關高應用價值資料的定義,本會已參考國內外的發展趨勢與政策,參考國內六大核心戰略產業、總統盃黑客松提案,以及國際 G8 開放資料憲章、歐盟、全球資料溫度計及聯合國永續發展目標 SDGs 所關注的資料主題,研析發現在國際上所謂的高應用價值資料不一定是跟經濟產值有關,因此可定義整個高應用價值資料為各機關優先提供可促進公共利益、社會進步、經濟發展、政府透明應用價值的資料,來滿足民眾生活的應用需求,同步改善社會與經濟的課題。

  • 另針對高應用價值資料的評估程序,德國為因應歐盟 2019 年所修訂的「開放資料與公部門資訊再利用指令」提倡的高價值資料集,已於 2021 年請法人機構完成「高價值資料集研究報告」,德國後續也會根據這個行動建議來作後續的推動。而我國評估程序部分也會借鏡德國下列研究報告重點的相關做法。

  • 第一個重點,是主題類別應劃分區域,並提出有潛力的子類別;第二個重點是應透過線上調查進行潛力評估來確認公眾的需求;第三個重點是應透過技術、法律、經濟來分析資料集釋出之可行性;第四個重點是資料集要成為高應用資料集前應要採取優化行動,並克服相關的挑戰;第五個重點為高應用價值資料應確保格式品質,如果是以 API 提供,應要遵循 OpenAPI 的規範。

  • 本會參考德國以上做法,已研擬五個我國高應用價值資料的評估程序,第一個步驟是主題範疇及子類別提案,相關提案至下一個步驟會進行公眾諮詢,接著會請機關進行資料集評估,並提出優化行動,進而釋出高應用價值的資料集。

  • 首先在主題範疇及子類別提案的部分,本會已參考國內外的發展趨勢,初擬六項高應用價值資料主題類別,相關主題類別、子類別及主協辦單位,各位委員可詳閱附錄。

  • 六項主題類別提案主要為氣候環境、災害防救、交通運輸、健康醫療、能源管理及社會救助,為進一步聚集群眾智慧,主題建議及相關的子類別,本會將透過公共政策網路參與平臺之「眾開講」來彙整民眾意見,後續再依主題請部會進行回應,並參考民眾建議來研提相關的子類別及相關的資料集。

  • 公共政策網路參與平臺上會詢問民眾對於高應用價值資料的主題看法與建議,以及對於主題是否有建議的子類別及資料集需求,進而蒐集民眾的相關看法。

  • 接著請主辦部會邀集相關協辦機關召開工作分組會議,本會參考德國已訂有高應用價值資料評估表,並將評估面向分為三塊,分別為技術、授權跟成本。技術是指資料集品質,主要是以機器可讀格式與 API 服務來作為評估的面向。授權的部分則是以授權條款,也就是依授權的程度進行評估。成本的部分則是依資料利用條件,如果是採資料集完全無償免費、不可撤回的部分是屬於「優」,如果資料集是採有條件提供、可以撤回的資料是歸屬於「可」。

  • 在評估表中只要屬「優」、「可」等級,即認同可作為高應用價值資料集,如機關對於資料集評估為「差」,則機關要採取相關的因應作法來克服相關挑戰,以利高應用價值資料集後續進行釋出。

  • 接下來步驟為優化行動,也就是機關依前述評估表研提相關資料集後,應提供行動方案的策略,內容至少應提到所謂面臨的挑戰及須採取的行動,以空氣品質微型感測資料舉例來說,因機關目前已採機器可讀格式,且已是開放資料,這部分即可直接轉換成高應用價值資料集,無需採取行動。

  • 另以生理健康數據 - 地區年齡性別統計舉例,這目前尚未有開放資料集,還沒有以機器可讀格式、API 提供,甚至資料集內容有涉及個資,機關採取行動時,就應該要針對這些挑戰提出因應作法,如資料格式採機器可讀,並對資料作識別化的處理。

  • 另外一個資料集舉例是地質監測衛星資料,這部分因蒐集費用相當昂貴,所以對機關的挑戰是跟收費有關,這部分會建議機關採取後續評估是不是採部分欄位免費提供,或是採有條件提供,比如以最小成本來收費。機關所提行動方案應併同資料集清單及預計開放時程,提交中央二級機關諮詢小組會議來進行評估與通過。

  • 上述行動方案策略,一旦經由中央二級機關諮詢小組會議審議通過,主辦部會就應依照行動方案,將承諾要研提的資料集與預計開放時程,優先將相關高應用資料集於政府資料開放平臺釋出,且應該定期檢視評估與更新,行政院諮詢小組後續也會陸續邀請主辦部會來報告推動概況及執行成果。

  • 後續推動工作方面,上述所提之評估程序及主題提案,後續會進行公眾意見徵集程序,於公共政策參與平臺上「眾開講」徵集民眾對於高應用價值主題的意見與建議,後續也會請各主辦部會協同協辦機關及利害關係人一起召開工作分組會議,進行各主題與子類別議題的討論與分工,以契合民眾需求研提相關的資料集,另外後續也會定期透過行政院諮詢小組來檢視主辦部會的推動成效。以上簡報,謝謝。

  • 我先問一下,因為你有預計開放期程的欄位,意思是高應用價值的資料,是以目前還沒有公開的為主意思嗎?或者是現有的,像現在接下來要聽運輸資料,民間也覺得這個很重要,所以就直接變成高應用價值資料?

  • 跟主席報告,如果機關現在資料集已經開放,而且透過剛剛簡報所提評估表進行分析,確認屬高應用價值資料集,即可直接轉換成高應用價值資料集。機關於預計開放時程欄位,則填報「已開放」即可。

  • 不用再問過外面,直接勾「已開放」就省去公眾徵詢的這一步,意思是這樣,謝謝。

  • 看委員有沒有要詢問或者是提醒的?

  • 不同部會因為業務執掌的關係,接觸到我們國家不同的產業體系或者是不同公眾意見的體系,我們現在用一個比較平臺化的方式,像平臺化的「眾開講」來作蒐集,怎麼樣讓部會能夠充分發揮他們的角色,也就是說,「眾開講」對內是一個比較弱勢的族群,弱勢族群對使用這樣的平臺有本身的經驗、意願都比較低的,這個體系所蒐集到意見的比例就比較低。

  • 或者某一些體系當中,他們有連動的社會效益,利害關係人未必很多,但是帶動的參與或者跟政府達成協議,在某些高價值應用價值資料上一起工作的話,那個社會影響力可以很高,我只是不曉得當我們要做跨部會分工跟挑選這樣的高價值議題時,如何處理這樣的議題,或者是讓部會也有發揮的空間,讓他們提出來他們的一些配合這個大方向的做法。

  • 所以聽起來「眾開講」比較像標配,但是每個領域跟每個部會有自己徵詢的方式,不但要在「眾開講」上說好比像要巡迴說明想要參加的話,這邊有更多參加的方法,不一定要在「眾開講」上留帳號,我想意思是這樣。

  • 去年我們就討論過高應用價值資料,其實思考價值這件事,我們都知道價值一定是要被用了,我們才感覺到它的價值,所以通常我們攤開看 5 萬、6 萬筆,其實很難從中大海摸針知道什麼是價值,但是我們看到第 6 頁,之所以可以訂出 G8、總統盃黑客松,比如總統盃用了,他們發覺那個資料集很有意義等等,因此如何創造使用的這件事,大概會決定價值,這個是我想要提的第一點。

  • 第二,我非常贊同在一開始有提到高價值並不是只有經濟,所以至少在紅色的這四個字,我覺得本身就已經在宣稱我們有公共價值、社會價值、經濟價值跟政府價值,所以這四個不同的價值如何抽取出來。抽取出來要做什麼,我觀察到德國做法第 3 點,也就是在第 9 頁有個表格,如果仔細觀察「技術授權成本」,比較偏向硬面向的,如果看到「優」、「可」、「差」,其實並不是告訴你它的價值,了不起評估能不能取得它、用了會不會有什麼問題,表格當中跟價值是無關的,但是如果在評估面向再拉出一個價值的程度,也就是說,我們可以辨認不同的 dataset 重新 release 的時候,是傾向社會價值高的、避難什麼的,或者是屬於經濟價值偏高的,像我們一樣是「優」、「可」、「差」的哪一個等級的,是不是比較有可能接近到、大家比較感受到是具備哪一方面的價值,也許高價值應用的評估表格,我們有了很棒的德國基礎,但是可以再去辨識。

  • 除此之外,因為這兩年在經濟部擔任 open data 的委員,我自己也觀察到經濟部的主題是資料集,其實我覺得真的滿好的,因此怎麼樣創造更多的這種主題是資料集,我覺得這個是我們可以 follow 的方向。除此之外,在各個部會的資料集,通常會有一個「我需要什麼」,也就是民眾可以套出來,就呼應剛剛志宏委員提到的,不是在「眾開講」上等人來投,因為這樣還是有點被動,而且對象還是有點窄,如果我們去觀察「我需要什麼」,我自己在各個部會擔任 open data 委員的時候,發覺當有民眾提上「我需要什麼」的時候,其實就會面臨到攻防戰,政府就會說為何不能提供、種種困難不能提供,但是民眾就會說偏偏需要這個,民眾需要使用它,但是顯然遇到什麼困難,所以沒有辦法提供,因此如何創造「我需要什麼」的機制跟管道,本身似乎在傳遞有這樣的需求。提供我自己希望高應用價值裡面的框架、機制可以再調整一下,並不只是再解決像剛剛所提到第 8 頁技術性的面向,謝謝。

  • 謝謝。整理一下,想要更多或者是互動專區,其實本身就是高價值的一份互動資料,裡面有把民間覺得重要的事情,其實已經有臚列上去了,而且也因為總統盃黑客松之前團隊的關係,變成並不是互相喊話而已,中間有一段攻防的可能性,因此可以透過分析這個互動,先找出一些不需要等他們來 po,因為之前幾年,攻防激烈的那些,大概都是有高應用價值,不然不會花這麼多的力氣來攻防,所以可以先賣這部分的資料,這個很棒。

  • 不過,我剛剛沒有聽得很清楚,機關評估這個是對資料本身可及性的評估,影響的評估本來是在前兩個階段,第一個階段是部會自己評估的影響力,公眾諮詢再加上新的 impact 可能性,所以剛剛委員的意思是,公眾諮詢回來之後,機關還要再評第三次,把它按照 ESG 或者是什麼東西 key 上去的意思嗎?

  • 老實說我們都知道不太可能是一個一次性的流程,所以在這裡流程如何減低大家的負擔,其實是很重要的,但是當公眾回來之後,機關這邊我想有一個重複確認是有必要的。

  • 我再補充一下,我一直投入在 open data 這個領域,各位有興趣,可以打「odportal.tw」,因為是一個很精簡的網址。這個其實是我們自己爬了中央、地方的所有資料回來,然後重新建構了「data.gov.tw」的民間版。我們會看到 data.gov.tw 大概有 5 萬 7,000 筆,可是我們自己爬下來的資料有 9 萬 1,000 筆,這裡出現一個很明顯的落差,現在這幾年來因為地方政府越來越有 open data 的意識,他們不上 gov.tw,他們自己在他們的地方政府平臺,所以這兩邊的數字,一邊是 5 萬、一邊是 9 萬,大家可以看到落差很大了,因此在這樣的情況之下,民眾又會開始出現一個困難,上了「data.gov.tw」,但是資料也沒有很完整,於是跑到地方政府去找,這個是我們嘗試自己弄的。

  • 除此之外,我們這個網站一進來就是文字雲,我不是要銷售這個網站,只是其實是有助於讓民眾看到要怎麼用,目前有哪一些關鍵字是有興趣的,就可以找到裡面的 dataset 就全部跑出來的,這個是新的 mindset,就是讓民眾知道可以怎麼使用 open data,總之是提供給大家參考,然後回應主席所提到的,當我們的民眾聲音回來之後,雙向的機制我想是有必要的,謝謝。

  • 謝謝,對於公眾諮詢,有點像綜整,也就是機關綜整過的某種格式,讓曾經提到過意見的人公開看到機關是怎麼收攏大家的意見,這個就像剛剛志宏委員所說的,有些根本不是「Join」來的,所以重新編目又更加需要,因為不能說把「Join」的討論看完就當作是看完了,顯然是有別的資訊管道,這兩個是相輔相成的。

  • 不好意思我再說明一下這個流程,其實當初為何會用高應用價值資料評估,因為現在的 open data 是由下而上,我們就請各部會提自己要開放的資料集,目前碰到最大的問題是,要開放都不是最想要的,而他們最想要的都沒有開放。因此我們那時就想一件事,如何怎麼樣知道民眾想要什麼,誰要先做這件事?基本上第一個是主題範疇跟子類別,當初是規劃資管處,像在黑客松或者是什麼地方「我想要」,就會知道大概哪幾個、哪一些資料集,就可以有提示,為何將來要到公眾諮詢?是因為要確定行政部門彙整的主題開放是不是民眾要的,所以公共政策參與平臺是一個管道,可以有其他的管道,我們其實有點像開放政府一樣,也就是用一個徵詢機制。

  • 到時大家就會就「我想要開放」的主題式意見進來,然後再作彙整,因為期望不見得可以真正實現,所以為何要到第三個機關去評估,當然剛開始設定主題資料,其實也會找各部會來然後看看,再看看那幾個評估標準是不是可行,就機關來說開放是不是可行,所以才會有所謂的機關評估,而優化行動,其實我要加的是,像高應用價值資料是有找各部會來,但是各部會不想開,因為他們覺得沒有錢、沒有人。

  • 什麼是優化行動?我們覺得真的需要開放,但是各部會有開放的意願,但沒有開放能力時,我覺得就可以用智慧政府、科專計畫支持,就可以在優化行動當中來實現,最後我們會希望將來的 open data 就是開放高應用價值的,也就是民眾真的需要的,所以我們可以做很多 round,第一個做完再做第二個,慢慢把我們的開放資料,並不是改變現在的由下而上,同時也由上而下的情況,基本上我們的想法、邏輯的過程是這樣子的。

  • 中間有很多行政程序,就是誰同意,像到機關的時候,也許開放資料的諮詢委員要提供意見等等,中間有一些是行政程序,因此基本上這五個步驟是這樣的想法,因此就來請教各位委員有沒有什麼意見或者是建議,如果可行的話,我們就可以開始 run。

  • 所以意思是每年做一次?

  • 不一定,也許一個 run 要做一、兩年也不一定,就是沒有一定時間的限制。

  • 瞭解。當然不會短於一年一次,因為剛剛提到進入預算週期,也就是一年一次或者是年一次為基本的想法。

  • 或者也可以滾動。

  • 是。剛剛有提到並不是公眾諮詢有進來的可能性,到機關評估、優化行動都會有相關利害關係人研商的會議,至於具體要開幾場、怎麼樣,就看那個部會的案量多少,意思是這樣?

  • 這樣比較清楚,謝謝。

  • 我個人非常認同國發會提出這樣做法,過去由下而上、現在改成由上而下的優點綜合起來。第二,從我過去參與這個工作的經驗,一開始時候供給方跟需求方的想法不見得完全一致的,政府認為這個是高價值,但是民間不見得覺得有高價值的,經過幾年以後,政府開放的程序越來越方便,我們的確是需要 top down,這個還是要從整個國家政府要把臺灣帶到什麼方向,我覺得有幾個大的國家發展重點政策,就會讓國發會、未來的數位部去規劃哪一個資料類別是我們需要加強的,又或者是現在各部會沒有這個資料,所以要帶上來,我舉一個例子,未來三十年國家最重要的是淨零碳排,這絕對各方面會有新的需要、產業的需要,會需要產業的碳排環境,可能我們部會沒有,但是這個又很重要,所以從 2030 年至 2050 年整個全世界臺灣就要做淨零碳排轉型工作。

  • 我想方法論是一樣的,經過這樣的步驟來回之後,這個機制讓國發會、數位部將重點國家未來需要的資料丟出來。第二個,這邊有談到社會救助,除了社會救助以外,像臺灣面臨社會人口很大的改變,不一定是救助,還有照顧的問題,所以我覺得有這樣的機制把過去做的一些東西,我們再用 top down 的方式,看哪一些還沒有這樣的資料,我們可以重點支持,讓這樣的工作來做。

  • 我記得歐盟好像有九個類別,我們現在把它歸納,看起來是非常重要,也是未來需要推動的業務,像災害防救、氣候變遷、能源管理與醫療,像在公共衛生這邊都有。社會救助要不要把救助的範圍稍微再放大一下,因為這並不是現在訂了馬上就一直到,像除了救助以外,還有跟照護等等各方面的部分,我們可以一起把過去的東西彌補過來,然後讓 top down 跟 bottom up 能夠發揮制度的優點。

  • 2050 年我們設一個目標,像未來臺灣三十年要走的方向,絕對是幾個國家的大方向,有必要在這個時候用引導式或者是擴大參與的方式,讓政府特別的預算來協助這幾個主管部會,甚至還有一些地方政府的資料,我們一起帶上來,謝謝。

  • 氣候我們是放第一個,絕對是最重要,重中之重。至於剛剛講到比較多的是社會包容跟共融,不是現在有什麼障礙,但是需要整個社會來轉型,我想這個也是滿重要的,所以確實是可以商榷的,非常感謝何委員。CK。

  • 因為剛剛提到經濟部的主題式開放資料策略,剛好我是第一屆委員,當年建議不要只依照當時的上級要求,也就是「以開放為原則」,除此之外,還可以超前布署,所以有做主題式。他們的做法是有一個系統建置案,工作範疇涵蓋主題式資料策展與經營。每年就可以持續更新,像剛剛高副提到成本,他們能編列預算交由廠商執行,就是用這個做法來永續,這個是第一個分享。

  • 講價值,價值的確並非只有產值,還有這個價值是對誰的價值,有 G2B、G2C,是否也能有 G2G?因為很多政府部門要這個部會或者是機關的資料是很困難的,甚至連溝通都缺乏效率,如果他們也可以從開放資料平台取得資料,這樣是最快。

  • 想要先討論有價值,然後再決定怎麼開放或者是能不能開放,實務上可能會遭另外一個挑戰。沒有用過資料的人不知道那個資料是不是有價值。舉例來說,像剛剛所提到的社福,我們處理過一個福利資料,是部會舉辦社福機構評比的得獎名單,若分析報名文件和評審結果,可能會找出機構管理的最佳實務做法,進而推廣至全國 4,600 個機構。

  • 最後,在執行階段,我們習慣會挑價值高、推動難度低的資料集。難度包括技術、授權與成本等面向。我建議在從評估盤點到決定的過程之討論紀錄,如果有可能的話,也要對民眾透明,讓民眾知道進度。

  • 最後是說類似一個進度條,我們在「Join」平臺,至少有一個好處,也就是搜尋引擎在下一個階段會有怎麼樣的進度顯示方式,這個是沒有問題。剛剛有提到 demand side,就分成之前民間已經表達過的,其實剛剛跟林委員所講的,我們去確認以前的不管是總統盃等資料也是同樣的建議。另外,還有一個建議是,如果我是其他政府單位的話,我要主張我的價值是 ESG 的「G」或者怎麼樣?也就是這個是政府透明,政府對自己透明,也是應該講得過去,這部分要請國發會資管處稍微回應一下。

  • 我覺得國發會很用心,列出了現在這六大類,因為從 G8、歐盟或者是 Global Data 看到像公司財務也是屬於高價值的,也有農業部分,我只是比較好奇的是,這六大類當中比較沒有經濟的資料,我不知道這樣的思維為何?因為政府把訊息弄出去的時候,講六大高價值,可能會有一種引導的作用,放到「Join」平臺上,民眾不曉得討論起來不知道是不是有一些負面⋯⋯也就是沒有被包含進去的,是不是會覺得政府有一些考量,這是不是說明要稍微清楚一點。

  • 另外,等到真正在做執行時,因為搶到第一個步驟跟第二個步驟,要跟部會做比較深度的討論,我不曉得部會是不是有一些心態,也就是把已經其實在上面很 popular 的丟出來,可是剛剛高副主委提到的是很需要需求量大,但是拒絕開放的,或者是有需求,但是現在沒有資料的(何委員講的),這兩個東西如何挖出來,這可能是跟部會溝通時,也就是國發會是要怎麼處理哪一些部分。

  • 國發會自己跑去「我想要更多」分析,或者是要求部會自己回去 mining?

  • 我那時就跟同仁說,第一個一定是國發會,因為要各部會提,就會說已經開了,或者是能開的就開,所以國發會要做的事,其實就是要做很多資料蒐集,比如從黑客松或者是從「我想要」的就會去瞭解民眾現在想要瞭解的資料集,事實上政府開放已經開放的這幾個領域事實上是沒有的。

  • 剛朱委員也有提到這個只是初擬,所以國發會首先要做的一件很重要的事是要把第一個版本提出來,這個大領域當中包含資料集的種類,並不是只有這六個名稱,我覺得要提到公共政策參與平臺的時候,還是要給各部會看一下,也就是看過一下或者是委員有一些給建議,也就是要經過一個諮詢的過程。

  • 在公共政策參與平臺當中,有點要證明這個就是民眾要的,因為透過公開的程序去問大家,因此到時會處理起來,就像開放政府一樣,很多的東西會湧進來。我們最後到機關評估時,我們還是要做篩選,我想政委都會很清楚。

  • 就是 6+N,但是事實上民間來的會變成 6+200,當然我們+N 還是要收歛一下。

  • 對,就是透過公開的程序。剛剛嘉凱也有提到這個程序全部都是公開的,我覺得透過這個程序可以真正反映民間要的東西,也可以真正實現開放政府的精神。

  • 其實剛剛您講的是「開放政府國家行動方案小組」組成的那一份做法。

  • 政委、各位委員,其實剛剛的討論,我們可以發現一點,臺灣政府在推動這件事已經在往前走了,這也是資料治理,並不是只有談技術問題,包含我們推動這樣的方法、思考邏輯與擴大參與,已經是另外一種層次了,所以可能不是限定在過程當中,在未來動態的過程,也就是在整個參與當中還會變動。

  • 像過去參加的工作,高副主委都很清楚,將來可能在剛剛嘉凱所談的 G2G 以外,事實上歐盟現在也談到 D2G,這部分未來也要考慮,像過去國發會一直想要推的,也就是 3D 地下管線的資料,如果臺灣有這麼好的管線,不一定只有政府機關,所以我們把它升級變成臺灣去推動資料治理整個階段的上升,這個過程中,也就是決定六個或者是固定的類別,其實是一個動態的過程,慢慢也思考到剛剛所有講的,也就是 3D 地下管線跟資安很重要的話,D2G 的機制,恐怕也要比較前瞻性去思考,到底政府要怎麼去架構,可能這部分我們慢慢也把我們整個政府在推動 open data 升級到另外一個所謂的資料治理的基本階段,謝謝。

  • 剛剛講到特別災害防救,非常正當的目的底下,自己做到某個部分,只差某個財團、某個跨國公司的某一塊拼圖,就會給他滿大的壓力,很像覺得應該入境隨俗一下,應該要提供資料給我們,我想這個是非常重要的,謝謝。

  • 其實我自己有參與的是監察院在立法院同意之下,把政治獻金的資料公開了,公開之後包含像臉書境外下廣告的資料就不得不公開,因為我們說這個跟政治獻金是同樣的道理,我覺得這樣子的想法,以後會越來越多,高應用價值的主題,民間跟政府有共識,對於經濟部門來講,很像必須 follow 這樣的共識,真的是很好的想法,謝謝。

  • 剛剛何委員有特別提到 ESG 重中之重,現在金管會有關於 ESG 的資料會加強來辦,因為現在揭露的永續報告書當中,有很多重要的資料,我們一定會把它變成資料集的部分,在今年可能 7 月就可能有七個種類會開放出來。

  • 在 2023 年開始,上市櫃公司就有碳盤查與相關的路徑圖出來,所以盤查以後相關的資料,也是會公布出來,我們會有一個資料庫中心,把這個資料變成有用,大家都可以參考的地方。

  • 現在大家都希望資料是機器可讀的,這個就會牽涉到申報端,因此怎麼樣把申報端開始用機器可讀的方式來作一些改善,永續報告書現在大家知道就像一本年報一樣,大家要分析的時候是不好分析的,所以我們在優化的部分,我們回去再來改進,因為這牽涉到太多公司申報,所以如果是標準化這種格式,是不是從大型的開始或者怎麼樣,我們再來思考,但是資料已經有了,如何把它變成大家認為可讀性的部分,比較好來做一些分析與運用,我們會回去再思考一下。

  • 謝謝,這個很重要,B2G 有一、兩家輔導它到這個情況,它的競爭對手覺得被比下去的話,也會有同儕壓力,這個部分是我們自己在做這個過程時,也一面去看民間現在 ESG 的相關揭露到什麼程度,我們公部門不能比別人差,但是我們更好的時候,也可以有一些牽引的作用。

  • 如果沒有其他想法的話,我們這一個部分「Join」的「眾開講」至少往前走,只是時程在「Join」上的公布,還有多於一種諮詢的方式。

  • 主席、各位委員,針對這個高應用價值資料主題的部分,就所列的規劃資料當中,類別一就氣候變遷、氣候環境的部分,剛剛誠如林委員也有提到,其實高應用價值用了才會知道,是不是具有高應用價值或者應該是 top down 的方式,才知道確實哪一些資料還有缺漏,需要能夠再精進的部分,因此氣候環境、氣候變遷,目前主管部會是交通部,不過我們建議是不是需要從氣候變遷主要的部會,也就是環保署這邊來進行主導會比較具有深度的探討,也就是說,還有哪一些資料其實是需要再補足的部分,協辦機關可以列為氣象局,氣象局因為相關的氣象資料,由氣象局積極提供,這個是責無旁貸,還是建議氣候變遷的部分,因為環保署也成立氣候變遷辦公室,而且氣候變遷因應法是環保署目前在主導的,因此我們建議主辦部會是不是需要再討論一下。

  • 這個牽涉哲學的問題,這個主辦部會是應用的主辦或者是蒐集的主辦,這邊有沒有什麼想法?

  • 因為感覺上前面與民眾溝通的部分,確實剛剛所講的,應用主辦比較知道應用的人是什麼,但是後面還有關於資料品質格式、取得方式與是否要收錢,這個只有蒐集跟處理的主辦才真的知道目前花了多少錢、pipeline 長什麼樣子,因此確實好比在氣候變遷的題目上,靠應用端跟蒐集端這兩個不同的部會,會有這樣的形狀;不過因為目前列成交通部,是以蒐集端為主。

  • 同仁沒有探討,因為我們今年才揭示 2020 的淨零碳排,因為氣候變遷比較著重在氣候資料,這邊的確沒有涵蓋很多環保署所蒐集碳排相關的資料,這個只是國發會的相關規劃,像嚴謹度跟主辦單位等等會再探討。

  • 也就是主辦單位可以再追加,但是交通部很難下車,講白了就是這樣子,因為你們既是蒐集端,又是一定程度的應用端,如果沒有問題的話就再往下。

  • 下一個報告案,運輸資料流通服務整合效益運用。

  • 主席、各位委員、先進大家好,交通部來進行交通運輸資料的服務平臺效益與後續規劃,主要簡報分成兩個部分,第一個會說 TDX 過去的歷史與現在的狀況,第二個部分是說明後續的推動方向。

  • 其實交通問題是民生問題,所以在各地方政府,像很早 7、80 年代就針對智慧交通、智慧公車的課題來作對民眾的服務,所以我們面臨到一個問題,大家發展的系統會比較早,所以資料分散的格式是不一致的,因此在 104 年左右開始,交通部就決定要建立國家級的資料標準跟整合的平臺,希望可以提供格式比較一致跟品質比較穩定的 API 相關服務。

  • 我們的做法其實是把各地方政府所建立的系統作交通部的落地落地之後透過各個領域的標準化資料,將資料轉成標準化的 API 跟資料格式,然後對外提供一個資料一致的標準服務。

  • 以公車的案例來說明標準訂定的方式,可以看到我們這邊列的公車站牌,其實大家滿熟悉的,也就是路邊的公車,其實都有站牌的路線資料、營運業者、票價、營運時間及是否有提供地底盤公車的服務資訊,這個是人可以看的資訊,我們透過機器可讀的標準格式來作資訊的拆解,我們會把資料拆解成業者端的資訊、路線服務端的資訊及現行的資料,然後人可以看到的資料,把它標準化變成機器可讀的格式,然後加值業者來進行相關業者的應用。

  • 也引用這樣的拆解民眾的資料,所以我們每一年以兩至三個領域的方式,從公路開始出發,然後做海、空的資料、票證的資料,現在甚至是有 AIoT 的資料服務蒐集,總共有 4,000 多筆以上的服務在 TDX 平臺上。

  • 因為比較是標準的 API,所以很容易被跨領域或者是跨域的加值業者去應用,因此到目前為止有 600 個以上的應用服務會落在加值業者跟政府端服務的部分。從去年開始,其實我們做了一件比較大的事,其實是把我們坐落在各個不同領域的平臺交通數據來作單一入口的彙整,其實單一入口的目的是要作會員中心這樣服務的構想,我們的方式是希望透過會員中心跟單一入口,能夠做 API 的控制跟資料進出的管制,然後可以讓我們比較知道民眾在使用我們自己的資料樣態,也可以針對大家所需求比較大的項目來作後續的精進與服務。

  • 接下來,交通部的 TDX 後續推動的方向,用這個圖大致表示我們現在的推動主軸,第一個部分是交通部的資料服務本業,也就是 TDX 持續蒐集。已經蒐集進來的資料部分,我們其實會持續強化資料品質,但是在新領域的部分,也涉及到民眾很多對於電動車充電需求或者是對於 DRTX 需求性公車或者是事件、事故資料的蒐集,然後再將近年來車聯網的資訊,其實陸續的資料一直進來,因此原有系統服務的架構還有資料的結構,其實跟未來所因應的方式不一樣,所以我們從原來私有雲的架構來導入雲端新系統的服務。

  • 這個是本業的部分,還有兩大部分,第一個是資料治理的內部應用,這部分我們發現資料上 90%的資料其實是從政府機關的資料過來的,所以政府機關的資料去作政府的數位治理其實是非常適合的,所以如何找到我們要做的課題,然後把我們的課題跟業務單位來作共識的形成,然後讓大家可以利用數據來作治理的工作,其實是我們內部現在正在進行的大任務。

  • 最後,是一個交通+N 的應用服務端,我們會把資料跟外界的商業需求、地方治理的需求、人才培育的加值應用來作整合,然後作比較新式的應用服務。

  • 剛剛那個是架構圖,以下有一個課題,也就是我們在今年與之後會比較著重的課題,第一個部分是交通大數據的匯流,我們會持續加強、加深跟加廣服務的範疇,我們過去都是以資料落地、標準化跟頂點、定時的服務,提供給外界業者來作標準業者的資料剪接,但是因應底層的服務比較是固定式的,但是因應上層,其實 AIoT、自駕車跟智慧道路等等的需求,其實不斷拉著我們去作資料結構跟系統架構的調整,所以之後我們會針對可能不定點、定時的資料或者是非副班標準的資料來上架進行後續因應的動作。

  • 在應用服務的部分,我們會加強我們的交通數據治理的部分,這個部分的實作是由交通部中央的資料跟地方交通單位的資料來作資料混搭,然後由地方來出一個題目,做問題導向的方式,利用資料的混搭來解決地方問題的答案服務,也希望這樣的服務可以落地,也就是到各個縣市政府可以複製這樣的功能,最主要是可以提升民眾的滿意度、創造數據決策的環境。

  • 以花蓮公車服務案例來說明,花蓮縣政府利用 TDX 的資料,跟地方業者交出來的是班表跟票證的資料來混搭,所以可以算出來花蓮地區公車路線發車準點率跟可靠度,還有發車的頻次是不是符合民眾的需求,還有步行距離是不是過長的課題,然後幫助地方政府來作路線的調整跟班次調整的依據。

  • 再來,商業應用加值的部分,我們今年是跟民間單位來作資料混搭,因為民間的電信業者透過 CDP 的資料跟交通 TDX 的資料來作混搭之後的資料集,這樣的資料集其實就是一個產品,其實也在市場上幫我們測試市場價值,也就是探測有無買主的商業價值服務。

  • 這邊簡單的案例是透過 CDP 網格點位的資料,再加上公共運輸的票證、車流的資料,然後大家可以看到資料疊合之後,會有一些比較熱區的地區產生,這樣的熱區資訊可以提供零售業者來作開店、展店設置的依據。

  • 另外一個資料,透過線上、線下資料整合來作人流特性的貼標動作,在捷運站周邊透過電信公司的貼標,可以在站附近所有人流的標籤特性,再加上實際上有刷卡進站的票證資料,也就是線下的特性來作資料標籤的混搭,然後這樣的資訊其實可以提供給捷運站周邊的商家可以作廣告推播的依據。

  • 第四個部分是提供運輸資料人才培育的部分,主要是希望能夠透過跟教育機構的合作,像辦理教育訓練、競賽,可以讓更多人知道交通資料的存在,也可以激發一些資料科學、民間加值運用的可能性。

  • 第五個部分,我們希望可以建立合理的數據經濟環境,這其實是兩塊,我們將會針對基礎資料來收費,然後再來是高價服務分潤的部分,在基礎資料收費的議題,其實因為我們有作會員中心之後,才盤點所有會員,也就是在網站上的使用行為,然後我們會發現 90%的系統資源在 10%左右的加值業者運用。

  • 像我們是 open API 的服務,然後 API 是非常標準化,所以很容易去做一定程式的開發。因此會把加值業者把所有的流量導到交通部這邊來作商業價值的服務,因此使用上其實是非常失序的狀態,因此在這樣的情況之下,我們會針對這樣的失序行為會作基礎資料收費的機制研擬。

  • 另外,在高價服務的部分,剛剛也有報告說我們也有針對企業界跟公部門有做一些合作,我們也希望透過混搭的方式來激發出資料高價值,可以讓這個平臺有機會朝向永續的方式來營運。

  • 最後的階段是,我們希望越多人使用我們的資料,然後讓資料的品質越好,越來越多人參與,這個生態系才會比較健全,也才會讓我們想要的交通+N 應用的部分可以更廣泛被這個社會所接受,以上是交通部簡單的說明。

  • 謝謝,非常精彩。

  • 我們可以看到是少數不完全用服務的角度,已經是用產品的角度在想整個資料治理的相關機關。看大家有沒有什麼詢問或者是回覆的?

  • 很高興看到交通部很勇於任事,在交通運輸的資料治理方面,很勇敢不管是在既有資料的標準、大平臺間的整合,也推出一些可能案例讓商業模式更多元,這個部分是可以肯定的。

  • 可是有一個部分是需要收斂的,也就是說,整體來看,這樣的規劃要能夠經過商業模式跟永續營運的測試,中間有很多的挑戰,原因是絕大部分這樣資料治理跟資料系統的規劃比較 dop down,如果要讓最後整個系統跟最後端的運用能夠永續經營的話,誘因、設計、永續經營模式的分析,可能要更加扎實,才可以收斂,不然就會發生剛剛所提到的,也就是某些平臺建置了,然後推廣應用了,某些因此有獲利,可能是肆無忌憚用了大量的政府資源在商業的運營上,交通部會覺得有點失序。

  • 最後到什麼程度不必政府來做,政府做到一個程度,其他後段是業者要搬出自己的平臺跟努力來做的事,公跟私的邊界與分野要劃在哪裡,這部分有基本的模式的理論,我建議後續在這個案例平臺的推廣上,這部分要有 criteria,不是政府平臺整合越多、越龐大越好,說不定最後那一段的整合,政府維持多個小平臺,但是最大的應用跟整合是交付給業者來完成。

  • 我會提到這幾點是因為我想交通部應該很清楚,全臺灣絕大部分的公共運輸都受到政府高度的補貼,應該六都各地縣市政府的運輸講的是公車或者是臺鐵,事實上高鐵跟幾個運輸少數除外,大部分是高度補貼,捷運也是。

  • 當我們有這麼多受到高度補貼、公共資源補貼資料與運輸系統,他們的資料呈現出來,如果我們可以運用這些數據來判斷、瞭解他們營運效率,來決定他們接受到的補貼是否合理,這時候所有的運輸部門會卯足全力用這些資料來提升他的運輸效率、驗證他的運輸效率跟提升能力,爭取後續年度持續的補貼,要是被證明沒有效率,對這些數據沒有效率的經營,補貼就要被扣掉,也會有一些罰則。

  • 我想這整個運輸資料數據的誘因設計就得到很大的新方向,這樣就不是交通部努力在做一些我覺得在資料數據上,最後可能很多是業者在做商業模式必須要注意的事,你們的戰線可以縮短,做在公部門最有必要、最有高效率的部分來做就好,把公私的分野藉機會釐清,然後相信後續的運輸資料匯集跟整個平臺的建構就可以達到永續經營,以上。

  • 謝謝,後面講的其實因為交通部同時有特許、建立與補助等等非常多的身分,似乎這樣子能夠回收比規費法要回收的多一些,如果用這樣的方式運用的話。

  • 不過我們當然並不特別反對規費法,也就是如果是少量使用是免費,但是本來的 open definition 裡面,有點實報實銷的意思,也就是如果你實際複製這份資料就產生這麼多的成本,就算回收那個成本也還算在 open definition,這並不是態度有什麼問題,縱使回收是有成本的。

  • 剛剛志宏老師提醒的還有別的地方效益,這個是滿重要的。另外一個是,是不是什麼資料都要往上集中,是不是有別的部分是放在民間的,這個也可以想一下,比較聯邦式或者是多中心的架構。

  • Follow 志宏委員的小建議,我非常認同志宏委員的意見,其中在第 19 頁有提到高價服務、分潤的機制,目前創造價值其實是從三個利害關係人來看,從企業面、公部門、一般民眾面,我這邊可以拋出一個想法,在前一個議題是我們的價值是有分為經濟價值主導,可是我們同時也有社會價值、公共價值、G2G 的價值,從某個方面來講,我們是經濟價值容易轉成商模,那部分的收費機制等等,剛剛志宏老師有提到了,如果另外一個部分是趨向於公共價值跟社會價值的話,政府就有比較高的業務性,必須要承接、運作這樣的資料服務生態的方向。

  • 所以,我只是想要說,也許在第 19 頁的 2B,這邊從三個利害關係人的方法,如果嘗試轉換成不同價值的方法,可能會長出不同的可能性,以上。

  • 對,很像對公部門有一些想法,也就是對別的部會、機關創造效益,好像可以用共同供應契約的意思,來客製化我們的交通部系統的服務,這個等於是用他們的公務預算來補這邊的營運,所以我覺得這個應該是滿有創意的概念,也就是別的甲方自己來當乙方的情況。看其他的委員有沒有要提醒或者是詢問的?

  • (與會者皆無意見)

  • 如果都還好的話,這個案子就這樣子,非常感謝交通部的報告,我們看第三個議題。

  • 第三個報告案是有關 CNS11643 中文標準交換碼全字庫自行檔案授權條款,提請討論案,接下來由國發會報告。

  • 各位主席、機關與會代表,大家好,接下來由國發會就全字庫字型授權的議題說明,全字庫的全名叫做「中文標準交換碼全字庫」,我們簡稱「全字庫」,是由國發會將漢字符號等進行數位化以後,提供字的編碼、屬性等資料,放在網路上供民眾運用。

  • 民眾全字庫已經收錄了 10 萬個字形與符號,字形來源是依照經濟部標檢局公布的 CNS 11643 交換碼的規範來製作字形。來源除了標檢局以外,還有姓名的用字,比如有一些民眾名字在標準規範當中沒有的,或者是醫學、化學的用字等等,我們就會編在暫存碼區中。另外,在標準規範中有部分字形是由教育部提供的,大概有超過 4 萬字以上。

  • 目前國發會將所有 10 萬字,大概分成宋體跟楷體的向量字形檔放在政府資料開放平臺,供民眾下載使用。目前的使用條款是依照政府資料開放授權條款第一版來進行授權的使用。

  • 本會資料開放小組諮詢委員 109 年時有提出了一個建議,希望除了政府資料開放授權條款以外,也可以增加開放資料字形授權條款,也就是 OFL 雙授權的方式供民眾下載使用,本會收到這個建議以後,我們就進行研究,發現教育部採用的字形是用創用 CC 的授權條款,我們就作了一個比較,也就是政府資料開放平臺授權跟 OFL 授權,最主要的差異大概有兩項,第一個是內容是不是可以修改的部分,教育部的創用 CC 是不可以修改的,但是目前政府資料開放授權條款是可以修改的,但是並沒有任何的縣市,而 OFL 授權的部分,內容也是可以修改,主要是修改後的檔案名稱不可以跟原檔同名。

  • 另外一個主要的差異是顯名的部分,創用 CC 的部分需要彰顯原作者的名稱,但是在政府資料開放授權條款跟 OFL 的部分,原則上是不需要彰顯原作者的名稱,所以大概是有這兩個主要的差異。

  • 如果採用雙授權的部分剛剛有提到就會在可否修改的部分,也就是有一些衝突,所以本會就邀集了教育部召開兩次協商會議,希望教育部能夠開放 OFL 跟政府資料開放平臺的授權條款,教育部回應是因為標準字形具有教育規範的目的,也就是開放、改作,所以不同意以政府資料開放授權條款來釋出,僅同意以 OFL 的授權方式來作為授權國發會來使用。

  • 基於這個理由,所以我們希望提到這個會議上來討論一下,建議是不是教育部基於資料開放的原意,是不是可以對全字庫授予 OFL 授權跟政府資料開放授權條款,如果沒有辦法的話,我們就是以 OFL 授權跟政府資料開放授權條款兩種方式,讓民眾選擇使用。

  • 第一個,我們會把全字庫的字形集,也就是含教育部的部分,以 OFL 授權的方式來供民眾下載使用,另外一個是把教育部的字形抽離出來,也就是下面看到的中文標準交換碼全字庫專屬資料集,以政府資料開放授權條款讓民眾下載使用,以上報告。

  • 謝謝,之前有請同仁在測試機上先稍微看一下,假設要切開來的話,就很快速說大概會發生三件事,第一個是 OFL 會列在可允許的開放條款裡,這個沒有什麼疑義,上載的時候就多了 OFL 的選項,我們就會推薦如果是有 OFL 的字體,現在也有一些公部門的機關,請民間去設計字體,程式標準用字、什麼標準用字,確實也有 OFL 的,之前他們都不知道可以丟到 open data 上多了一區授權是介於軟體跟資料中間的東西,也就是字形,這是第二個會發生的。

  • 第三個,我們在測試機上,已經試看看把它切成兩個,全字庫是 OFL 授權,自己的一筆。全字庫不受教育部的授權影響,就放在還是政府開放資料的授權條款,所以這個是稍微背景跟大家講一下。教育部的同仁有沒有要跟大家補充?

  • 主席、各位委員,教育部就這個議題,我想還是簡要來作背景說明來跟委員報告,因為當時要配合標檢局中文標準的部分,所以我們在 96 年時先把宋體標準字形檔送給經濟部標檢局作印製碼本,就是第一至第七個字面的部分,也作為當時我們有授權的依據。

  • 在 99 年的時候,教育部已將經宋體字形免費各界使用,但是前提是不同意改寫,所以我們要求創用 CC 禁止改作的方式來作授權,禁止字形塗改為基礎。國發會的長官在簡報中有說明字型檔如果涉及到改作,會產生教學現場的混淆,這部分涉及教育部的立場。現在國發會已經把 4 萬 8,000 個宋體放進全字庫當中,為解決國發會的授權問題,我們同意用開放字形授權,也就是 OFL 的方式,讓國發會來修改,但是請不要註明資料字形是由教育部提供的,而是由國發會去修改或者是創作的部分。

  • 再來,因為國發會目前採取政府資料開放授權的方法,現在面臨的問題是,108 年開始我們陸續接到很多民眾表示,從國發會所找到的字形跟教育部的寫法是不一致的,也就是說現在社會大眾對於標準字體已有產生混淆情況,而這是我們現在面臨的困境。因此,對於要開放授權方式,將會面臨到三個主要的風險,我想提供給大家參考:

  • 第一,在教學現場,標準字體大部分是在國中、國小使用,有一些家長會使用教育部的標準字形,因此對於字型檔修改的部分,我們是非常謹慎在處理。如果教科書或者是字典因為使用不同的字形檔,也會產生一些混亂,比如「戶」字第 1 筆,本部標準字體是「撇」,但是有人是使用「點」,這個會造成學生學習與教師的教學產生混淆。

  • 第二,在評估社會觀感的部分,因為國發會是政府機構、教育部也是政府機構,但是產生出來的字形卻是不一致的情況,外界會質疑政府主要的公信力在哪裡,這個是社會觀感的部分。

  • 第三,教育部被賦予國家字形、字義標準訂定的責任,所以公布標準字體的部分比較是屬於教育規範的性質與目的性,因此要開放各界對國家字形規範的修改,是不是妥適,我想這個是必須要思考的。基於前面這樣的論述,及為解決國發會授權的問題,我們建議是不是還是採用 OFL 的方式去做授權,除不要標示來源單位是由教育部來提供,最重要目的是避免教學現場與社會各界對於字形體的混淆。

  • 至於,剛剛國發會提出解決方案的部分,提到有關於全字庫專屬資料集的部分,包含三個部分,我們想要問的是,字形檔的部分要把教育部所訂全部字形拿掉的話,在 10 幾萬的字形庫當中,教育部有 4 萬 8,000 個字形,抽離出來只剩 6 萬多個字,民眾在應用上會不會有一些困難,這部分可能要思考。

  • 針對解決方案的部分,我們在會前有討論一下,如果全字庫專屬資料集的「全字庫字形檔」,我們仍傾向以 OFL 的方式處理,至於資料庫的「屬性資料」及「中文碼對照表」部分,採用政府資料開放授權的方式,我們沒有意見,以上說明,謝謝。

  • 謝謝。我們到附件 11 頁那邊,大家可能比較容易想像,剛剛教育部具體的建議是,我們把底下這個資料集當中,就算授權無所謂的部分,也就是本來真的也可以用 CC 授權、OGDL 授權的部分,我們也往上提,意思是全字庫反過來變成教育部吸收其他字形,然後所有的字形都變成用 OFL 出,意思是這樣子,也就是不要特別去分 6 萬多字的一個、4 萬多字的才可以完全顯示,剛剛聽起來是這樣的意思。

  • 國發會有改作你的字形檔嗎?也就是標準體到全字庫,是有改作,或者只是合定本而已?

  • 改作的部分,一個是字圖的改作、一個是擴充跟減少字數。基本上我們不建議有字圖的改作,至於字數上的擴充增加或者是減少,是沒有問題的。

  • 國發會進行的改作,應該是從之前原行政院主計處電子處理資料中心時就有,也就是在國發會組改前,就我的經驗,的確有少部分的字形有被改動的情形。

  • 也就是全字庫的顯示跟在標準體的顯示不同?

  • 真的不多,基本上他們也不願意來改教育部的東西。

  • 但是你們的主張是應該以教育部為準,對不對?

  • 我們希望不要造成民眾混淆,出去的字形,我們樂於把字形放開,但是不要讓民眾覺得字形有些是符合教育部的、有些又不符合教育部的。基本上我們只希望他們(國發會)用沒有關係,但是不要顯名是教育部的。

  • 但是全字庫字形集目前,看起來是改作後不能再用相同的名字,也是不能再叫「全字庫」,這邊並不是教育部標準宋體、標準楷體,這邊從頭到尾都沒有出現「教育部標準」這五個字。

  • 那個是第一個部分(指 OFL 授權),第二個(指 OGDL)有三個資料集,其中教育部字形檔如果抽離了,我們基本上都沒有意見。

  • 但是我的意思是如果把第一個也變成可以用同樣的名字,然後給人改作,也就是本來的 OGDL。這樣留下來的名字也是「全字庫」,並不是「教育部標準」,所以並不會侵害到「教育部標準」這五個字。

  • 對,沒有,所以我們才同意採用。

  • 但我的意思是不是用 OFL,而是用 OGDL,也就是目前的狀況,可以改作,改作之後不用改名字。可是沒有改的名字也是「全字庫」,並不是「教育部標準」,你知道我的意思嗎?

  • 我知道,只是對外會說一到七是來自教育部的。

  • 所以你的意思,反而是把「教育部」三個字拿掉你就沒有意見?不顯名就可以?

  • 最主要是不顯名。

  • 聽起來是整個字形集不改,也就是 OFL 雙授權、OGDL 從頭到尾就不要出現教育部三個字,反而你們就 OK?

  • OK,很有趣的立場。

  • 國發會補充說明一下,剛剛教育部提到國發會來改作這個教育部字形,我這邊補充說明一下,國發會並沒有改作教育部的字形,剛剛講字形不一致的問題,主要是當初送到標檢局時,那時公布的是書面的,可能在製作的過程中,一直承襲全字庫是從 92 年開始,主計總處開始製作以後,那時有一些字形的不一致狀況,所以我們現在也在清查目前跟教育部字形不一致的狀況,我們也慢慢在做調整當中,希望能夠做完全一致的情況。

  • 另外剛剛也有提到,OFL 授權的部分,其實在我們開放資料平臺授權時,並不會出現教育部提供的字形,所以原則上我們還是希望如果教育部比較 care 不要出現「教育部提供」這個字形檔的話,其實在我們開放資料平臺授權並不會出現這個字眼,是不是也可以提供開放平臺授權給國發會使用?

  • 以第 7 頁的方案一來講,教育部有兩個條件,第一個是不管字形檔的註釋或者是說明文件,總之從頭到尾都不要出現「教育部」三個字,第二個是不要有一種很像這個是標準,「標準」最好也不要出現,「教育部標準」連寫絕對不可以出現,但是就算教育部拿掉,也盡量不要主張這個是什麼標準。

  • 當然我們是中文標準交換碼,所以在標準交換碼的那幾個資料夾可能是避不掉「中文標準」的四個字,但是在字形那邊就不要出現「標準」的字眼。從教育部的角書,只有標準的楷書才是標準,簡單來講就是這樣子。

  • 我覺得這個是很合理的,其實以提供方來講是很合理的要求。各位聽了這 15 分鐘的發言之後,有沒有什麼想法或者是建議?

  • 如果沒有,那就叫「全字庫」,不要叫「標準」就好。

  • 如果按照政委這樣分析以後,如果都不出現教育部相關的字眼,我們是不是就恢復政府資料開放平臺授權條款?

  • 就是雙授權。等於我們還是要把 OFL 加到授權列表裡面,但是我們就變成這個資料集同時在下載的時候,可以選擇把它看成軟體或者是資料,簡單來講是這樣。

  • 我們就麻煩同仁這邊再次清點一下,也就是在包含附註說明等等,都不要出現「教育部」,這個是絕對的要求,然後盡量不要出現「標準字體」的講法,這樣可以嗎?

  • 如果可以的話,我們就這樣處理。

  • 接下來有臨時動議嗎?

  • (與會者皆無意見)

  • 如果沒有的話,不好意思,稍微超過一點時間,今天就到這邊,謝謝。