• 風傳媒在明年1月底的時候,我們會辦一個醫療AI論壇,主要探討的議題是想要創造產、官、學的對話,因為現在AI醫療論壇很多,要談臨床意識端喚起他們的意識,希望可以接近這一個產業一點,不要離太遠。

  • 因為對於醫療Open Data的這一件事,大家都有諸多的討論,但是都沒有開放、跨部門結合,像跨醫院結合的這一件事,其實大家都不知道該怎麼做,或者是有一點困難推動,說老實話。

  • 因為我們是的panel跟工作坊。

  • 1月25日早上。

  • 早上是行政院院會,我要請院會的假要很特殊的事情(笑)。

  • 那一場可能會請到衛生署。

  • 衛福部,底下有健保署。

  • 會請到衛福部的官員來,想說這個機會滿難得的,因為唐鳳的經驗,對於Open Data這一塊滿熟悉的,但是衝擊到醫療這麼傳統的領域,他們已經有這麼多data了,卻沒有辦法有效開放或者是推進下一步,我們想要盡一點心力。

  • 當然我們所謂資料治理,一般分成Open Data、Big Data、My Data,開放資料、巨量資料及個人資料,其實開放資料跟巨量資料有一些重疊,巨量資料跟個人資料也有一些重疊,但是開放資料跟個人資料是不重疊的,你剛剛提到的一些困難,就是在有一些朋友希望把這兩個重疊起來,但是我們按照目前的個人資料保護法,這兩個其實是沒有重疊起來的空間,我想這個是最核心的。

  • 但是其實這一件事,其實衛福部比誰都瞭解,你們請到衛福部的人……我的意思是我去不去都一樣,他們在法令的立場不會有任何的改變,除非個資法修法,或者是大法官對於最高行政法院的見解有什麼變更,不然就是拿最高行政法院在台權會告衛福部那一案的見解作為目前行政的依據。

  • 所以其實要鬆動,大法官可能沒有什麼論壇可以施力的地方,我要講的是這個。

  • 那像以健保過去累積的資料來講,這個有可能去識別化之後有可能是大家使用的嗎?

  • 去識別化就不好用了,財政部去識別化有一次公開的情況,有一個地區叫做最小統計區,每個人有不同的收入,可以作一些分析,包括人口的遷移,又要保障隱私,如果是最高的百分位,而其他人都不是,你就知道是誰了,他就把這一筆拿掉,但是你算中位數、平均值或者是什麼都是錯的,因為資料拿掉,所以按照目前對於個人資料的保護,對於任何一筆,都只有1/K的機率才真的猜中才知道是誰,K真的要滿大的,以財政部的例子是20%,如果那個地方只有一個人,所以是百分之百,那就要拿掉,因此這個時候就要拿掉,找不到其他的人有類似的情況。

  • 這個是有標準、方法及流程,操作過之後學術圈給我們的回應,拿這樣的資料,問題不是好不好用,而是怕做出來的研究結果是有問題的,因為已經知道資料有損失,而且不知道損失差在哪裡,所以這個時候並不是我們在法令或者是行政流程上欠缺什麼,而是用Open Data的去識別化來進行研究的這一個流程,只適用在某些特定的情況,在大部分的情況下當你保護個資去識別化後,研究的效力是有限的。

  • 國際上有另外一個反方向,開放演算法,我把演算法公開,這個是統計方法,各專家來看這一套統計方法,不會造成隱私損失,可以控制在某個值以下,這個時候就等於用一個不是很好的比喻,有一點像超超連結,也就是污染排放量,也就是大家都已經審核過了,會造成滿少的污染排放。

  • 在這個情況下,這一套演算法是由資料擁有者去運行,發布的也只是統計過的資料,也就是資料從來沒有離開他,只是用一個大家已經認可對個資沒有侵害的方法,自己這樣子跑了之後,把跑的結果放出去,就是這樣。

  • 這樣的好處有兩個:第一,各國有類似資料的機關都用同樣的演算法,才有可比性,不然沒有可比性,你不知道個資丟掉了什麼,只是最簡單算平均,然後做比較,那個也是錯的,所以到底要怎麼做研究?

  • 反過來,如果是用開放演算法的方式,拿出來的東西是相同的統計效度,原始資料看不到,這個是第一個好處。

  • 第二個好處是,在歐盟GDPR指令,之後APEC也會有相同的情況下,各國的代表團,也就是每一個國家有各自的專家機關,這個代表團可以就事論事討論,可以如何針對某些演算法如何繼續減少污染排除,也就是個資的侵犯性,大家就會有一個共同的焦點,但是如果本來是去識別化的做法,每個國家不知道其他國家的標是什麼,像排除各個不同的地方,有化合物的情況,就沒有辦法進行國際上的討論。

  • 我自己覺得朝向演算法公開、其他沒有要公開,在對個資及社會有利的研究上是比較合適的。

  • 資料現在建議留在各部會的手中?

  • 其實我的個人資料,應該是我自己才有控制權,像我現在是希望衛福部那邊有一些我的個人資料,但是我去衛生局辦理長照相關業務的時候,我希望能夠過來,這當然應該是可以的,但那是因為我知情,第二個是我授權,這個時候國家的機器最需要做的事是格式的欄位要共通,如果不是共通的話,會有一個很可憐的承辦,左邊看一個、右邊看一個,然後用手抄,我們現在是透過智慧城鄉跟平台來作非常積極的互通,但是在這個中間是目的內使用到目的內使用,只是一個流程的順暢不用經過人的自動化。

  • 但是在這個情況下,是這個人來臨櫃的需求來辦理,並不是為了別的學者而辦理,這個部分叫做My Data,這跟Open Data是兩件事,完全不衝突的。

  • 會有這一次的醫療論壇,其實我們想要做一整個系列,我們想要探討AI或者是數據發生在每一個產業的變化,像醫療就會有非常多的數據科學家加入這一個產業,原本不是醫生。

  • 也有很多是……

  • 臨床醫師。醫療有分新創團隊,或是臨床醫師有加入AI醫療的生態,也想做一些事,因此才發現有這一些問題,大家想要往前卻沒有辦法往前。

  • 我們自己有拜訪過幾間廠商,有發現臺灣硬體思維還沒有辦法轉到比較偏軟體端的思維。

  • 如果以醫療這一件事來講是這樣,等於是臨床醫師跟硬體端還沒有辦法接軌,是中間很大的斷層,而這個斷層是我們想要解決的問題,會比較像這樣子。

  • 之後因為剛剛有提到醫療是先談,但是在AI發生的這一件事上,其實可能會出現這樣的斷層與落差,我們想要把真的是在產業中每個角色都串起來之後,再形成一個真正完成的生態圈。

  • 我比較不會用硬體或者是軟體思維來想,但是我比較會用產品思維跟服務思維來想,因為其實在臺灣有一些朋友們,他們也是把軟體當產品,如果把軟體當產品的話,那其實也是一個生產線的概念,所以我們在軟體工程裡面叫做瀑布式的開發方法,如果把軟體當成產品看,最後的思維也是一樣的,不會是一家軟體公司就比較靈活或五是比較能夠接觸第一線使用者的需求,因為就是賣套裝軟體。

  • 同樣的,即使是硬體的廠商,有一些我覺得已經導入了服務設計的思維,等於是服務設計為先、產品設計為後,以前都是產品設計為先,服務再說吧!可能請一些市場調查公司(笑),但是服務設計的概念是說你從一開始就要把使用者納入你的設計,而使用者裡面有代表性的當然很好,但是更重要的是極端值的各種使用者,而這一些極端值的各種使用者才能更完全。

  • 你考量這一些的時候,才會知道有一些不是你的產品可以做的,甚至你的內部或者是組織要調整,又或者是公司運行的方式或者是產業鏈的位置,想要達成產業服務設計的目標想要調整,我覺得這個才是擺脫產品服務設計的思維。

  • 政府是臺灣最大的合作社……NPO(笑),我們也正在做類似的事情,像報稅軟體就找了不好用的人來一起設計,像網站覺得不好用,我們就邀請青年朋友一起來討論跟設計。

  • 我們之所以會想要做這樣的系列,其實也有很多在談AI產生的變化,也就是有哪一些願景跟運用,但是我們面對我們的讀者,很多的感受是好像從兩、三年前一直出現,但是卻沒有什麼變化,因此我們想要讓他們知道有哪一些產業發生轉變跟哪一些跟生活息息相關。

  • 因此我們之後會選題像教育、金融或者是智慧城市等不同題目。

  • 但是我想服務設計做得好,目的就是要感覺沒有什麼變化,我用這個書寫跟本來是一樣的,但是這個確實是尖端科技,因為才沒幾年,這個是比較大的對技術想像的差異,以前覺得「破壞式創新」是社會要適應技術,但是要用服務設計的角度來看,是最小調適越好,讓大家無形中生活更順利了,語音輸入,但是後面是很棒的AI,你也在講話,這個是我自己期待AI創新一個很重要的設定,如果不是這樣的話,我們舉自駕車當例子好了,好像是少數人在主導自駕車的發展,好像少數人非接觸不可,但是我覺得從慢速的,像空總有人在試驗路駕的三人車,大家就熟悉,知道怎麼跟新物種相處,如何知道時速20至60的時候要如何互動,大家不會覺得意外,最小化的意外是我們在跟AI相處上很重要的另外一件事。

  • 我想問另外一件事,如何看臨床的醫療醫師?因為以前曾經沒有受過這樣的衝擊,我不知道您怎麼看臨床醫師對於AI的這一件事,也就是要參與到什麼程度,或者是應該促進臺灣醫療進步的這一件事?

  • 因為我知道中國大陸或者是其他的,其實已經非常快速發展了,我不知道臺灣卡在哪一個階段,或者是我不知道政府是不是真的有拿出來討論過這一件事?像現在科技部跑得比較前面一點,但是衛福部或者是其他的,感覺不要碰就不碰,好像有一點害怕。

  • 這個跟衛福部本身的社會使命有關係,衛福部並不是一個發展產業的部會,而是照顧大家的衛生與福利,我覺得這個也很好,如果我們說科技部是做研發,如果以剛剛無人車來講,交通部要做把關,要確保上路是安全的,所以看的指標並不是產值多少,看的是塞車有沒有減少,有沒有路上車禍減少等等的指標,所以你說它保守,也可以這樣講,但是其實也應用了非常多先進的技術,但是達成這一種社會使命,絕對不是產值或者是別的社會使命。

  • 有一些其他的國家,不只你剛剛提到的,所有的部會都是經濟部,這也是有可能的,但這樣的話,在那一個面向上的表現,也許看起來會非常快速或者是非常強,當然在後面的,就是會不會讓一些人系統性的人權上受到一些侵害,因為AI的特點是幫你做判斷,但目前沒有辦法很好說明為何這樣做判斷,它的說明可能是五千頁,也沒有人看得懂。

  • 當然這個部分是可解釋的AI,這個也是很紅的研究領域,但目前的研究成果還沒有很清楚之前,所有部會都是經濟部的地方就已經願意投入,這個時候就會產生系統性的bios,像之前很有名某大廠商線上雲端照片儲存會自動幫你分類,裡面出現什麼,但因為訓練的資料集裡面,大部分的人種是比較單一的,所以當看到黑人的時候就看到黑猩猩,這個時候就會造成一些困難(笑)。

  • 有些地方在這一種情況下還是願意試,但是在臺灣的情況下,衛福部會希望在比較少的、比較創新的,我們叫做「沙盒」,也就是踏入這一個地方,你是已經知道這邊正在做實驗,這個實驗很可能示範,這一種情況還願意踏入,這種心裡已經有準備了。

  • 像最近的金融沙盒,也就是金融創新實驗條例,如果現在想要用區塊鏈,也就是新的東西來作金融,我們也不會說ICO就禁止,但是我們會說如果要變成一個適當的行業,就要先在小規模,也就是自駕車是在慢速的情況下先作測試,也就是先讓社會看到讓你相處,如果大家覺得這個是好主意,那就調適,我們並不是緩慢,但是我們上正式機之前,我們在軟體機先測試,測試六個月或者是一年沒事了,我們就上線,如果測試飛機六個月,有一群人系統性的被認為是黑猩猩,這時就沒有可防禦之處,這時就必須實驗終止、血本無歸,感謝他幫社會付了學費,下次就不會再用這個演算法。

  • 我覺得階段式的創新及每一個區域是以他區域的需求,而不是中央要求地方,這兩個是我們的治理模式跟你剛剛提到政權主要的不同。我不覺得哪一個有特別的好壞,我覺得人類文明有各種不同的模式跟不同的貢獻,我們並不覺得需要在其他的緯度上去跟其他人比,我們在這一個模式裡面把它做好,我覺得也是可以輸出的。

  • 可以瞭解你的時間?

  • 禮拜四是三點以後有空,禮拜一是兩點以後有空。邀我的活動就必須跟社會企業或者是社會創新有關係,我禮拜三理論上就是早上10點到晚上10點有關係。

  • 我們先以這兩個時間為主,我們有用FB敲你。

  • 是嗎?你們可以email。