對,不能做槍、販毒的這些事。
我知道你的意思,你的意思是這個 AI 驗測實驗室是對任何 AI 的產品,因為先有 regulation,要有一個驗測實驗室,所以這個是不管有沒有 ChatGPT 都要編錢的。
即使是沒有 ChatGPT 這個 issue。
其實我在推 AI 2.0 的時候,我特別有講說對 AI 產品的驗測,這個很重要。
那個就編下年度,現在是要跨部會署提嗎?
全部是 2 億,如果是數位部,我算大概是 1,500 萬左右。
給數位部多少錢?
對。我找你有兩個目的:第一個是看跨部會署科發基金,數位部是不是願意合提?因為目前的規劃是國科會主提,應該會委給國研院,數位部合提的部分,像做這些 1999、政府法規,讓一些基層的公務人員去玩一下 ChatGPT、蒐集這些比較有目的性與實用情境來切合民眾需求之資料,然後反饋回來,這個是數位部的角色。
目前真的是專注做,我只是說你做出來這些核心的 model,已經讓國網有這種技術上成長、落地的一些應用,因為畢竟拿政府的錢。政府對民眾服務與溝通的這一塊,你可以支持,有這樣自己的⋯⋯
其實要弄 search 引擎也不難,現在只是會有 delay,就是這邊的技術,我也沒有把握以臺灣現在的技術可以跟 Bing、Google 來競爭。
看你要不要讓它翻轉?要不要弄個台版的引擎?其實有點像是你 search 的 domain ,不用這麼大、且更新快,沒有像 Google、Bing 這麼難。
因為臺灣兩個搜尋引擎都死掉了。
後面的搜尋引擎其實臺灣有人做,到底要不要把它綁進來,這也是一個機會。
對。
目前 ChatGPT 也是幻想。
我知道你的意思。
所以我們用 BLOOM 這些來做。第二件事,我們不教你去寫程式、寫數學問題跟講笑話,這並不是期待未來臺灣版 ChatGPT 有的功能,因此我們做的時候會特別列中翻英、英翻中及文字編修跟要點,比大家現在正在玩的 ChatGPT 功能有限縮,但是我們希望做出來的東西,就是未來可能的應用。
即使是 ChatGPT,ChatGPT 也燒了非常多錢。
目前沒有特別想這件事,第一個問我的問題是,假設給你 2 億,人家已經花了這麼多錢,憑什麼你覺得可以做?
所以 Bing 的做法是:我可以回答,但是我給你官網、reference 的東西。
其實他們講的,我那天聽微軟 demo,他們在講 teams 除了做逐字稿,也可以做摘要,action item 都出來,我都很想用。
我相信。這個是文化滲透,讓你使用習慣,所以就是從國安上的需求,還是很希望臺灣能夠有這個。
我也跟部長提一下,這件事我花了一、兩個月,一開始很大的憂心是,當抖音來臺灣的時候,我們沒有辦法跟民眾溝通叫人家不能用,但當你自己有一套百度的 ChatGPT 出來的時候,你可以說有第二個選項可以使用,我們的用詞比較臺灣風格,所以這是另外一層為何臺灣非做不可的原因。
他的意思也是如果有臺灣的可以用,最後也不用太擔心這個 data 是被怎麼樣。
我們當時講說臺灣要有自己的一套,其實這個很多業界感興趣,除看到聯發科在講,台達電也在講,其實前兩天玉山銀行的數位長說玉山銀行內部為了這個 ChatGPT 做了黑客松,其實我看起來很簡單,一個使用方式是讓使用者輸入的時候,submit 給 ChatGPT 之前,就把玉山的 regulation 附上去,所以就在那邊做。
台北市政府花錢沒有關係,很快讓民眾享受這樣的服務,但是控制能力比較低,他對談出來的東西有一些牴觸,或者是不符合法規,可能要重新叫他們客服再修,我們這邊一開始就可以⋯⋯
因為以後就被微軟綁死了。
因為前面社群的部分是比較發散,後面是比較 focus。
對。9 月的核心程式應該也有一些能力了,再把一路的東西做校正,12 月可以 demo 除了一般你問它問題、它跟你對話以外,它真的可以替政府服務人民的角色。
那 1999 可以收回來的話⋯⋯
這裡面有一點是,一般 1999 是 Q&A,但是我們應該要用 section 的概念,我可能是 5、6 句在服務一個 case。
對,1999 的資料我們怎麼取得。這裡面會涉及到當政府部會對民眾做服務的時候,裡面如果有一些個資的話,可能要有一些去識別化的處理,我覺得數位部在跨部會署科發基金⋯⋯
我很希望的是,如果在跨部會的科發基金中切一小塊錢,拜託數位部讓各個政府基層去使用我們的 ChatGPT,因此知道民眾常常問的問題是哪一類,他們又是怎麼答,然後把它蒐集起來,我們一方面也知道民眾會問什麼問題,這個我會在 9 月份開始做。
我說是不是要趕快架一個社群平臺?我們想要做這件事的理由是,現在都還沒有做,所以有這樣的機制,我就蒐集一些民眾去問 ChatGPT 的問題,我 12 月 當我自己去 demo,他們說有自己的橋段,所以答得很好,我說當時收了一大堆東西,我就 random 選,選 ChatGPT 3 回答,這個是台版的回答。
今天我們要建造一個屬於臺灣版的 ChatGPT,我們想要透過參與,只是有時在那邊玩⋯⋯我本來提一個構想是,現在 ChatGPT 4 還沒有出來,我們就說我們每個禮拜結算,如果 submit 最多的,就給你 20 元去 unlimited service。
對,就是為何大家願意用舊的。
那天微軟來談的是,OpenAI 給他們專屬授權,所以所謂的 GPT4 事實上是微軟在用,沒有地方用得到。
微軟的說法是 OpenAI 做的是實驗室的,他們對於 service 的細部不清楚,但是他們對產品的掌握度很高。
他來我們這邊說要合作,他說他們要幫我們爭取,我們說我們可以蒐集問題,因為他們有企業專屬版,他可以很快的⋯⋯因為個人現在 40 個 request 就停,即使付錢,service 的順序也不會排前面,他們說我們可以蒐集問題,他們幫我們蒐集答案。
微軟禮拜五去科技辦,那時因為蔡志宏主任 host,我直接跟微軟講我們要做的理由是,國內沒有人訓練這麼大的 model,我們的國網沒有做過這麼大的 model,所以我們有這樣的目標,我們不只是要當他的客戶。
他說他不願意授權。
現在就開始到處在 sale,就說很多東西是 OpenAI support,然後服務是微軟來做。
因為 3 月那一版 GPT4 是唯一授權給微軟。
是。然後就讓 1,000 個社群去使用,你就可以把這些東西變成回饋再作人類的 Reinforcement learning。
可能會講一些亂七八糟的話。
3、9、12 月都是 check point。我早上有給部長那個 slide,9 月份我們希望有 1,000 個帳號讓社群來使用,然後 12 月就是 1 萬個,3 月份可以正式再做一個更大的。
因為有一個 prompt learning,那個會做,我們不是單純把資料倒進去而已,因為那有一個評分系統,你講綜整的能力,那其實透過那些,那個是我們會做的。
闕次有沒有什麼想法?