好比:模型的能力強大到某個程度,要經過多少紅隊演練,試著讓它做壞事、確定都沒有問題,才把它放給不同人來使用?要等多久才釋出?因為如果不解決這個問題, OpenAI 或其他的 lab裡面的人真的都找不出太大漏洞,就釋出了。現在民間都有對齊技術,對齊是往一群人或是某個個人的偏好對齊,但世界上也存在某些人,他的工作就是用不法的方式,去損害別人謀取自己的利益,也有這種人。當然如果現在世界上完全沒有這種人,也許很多安全問題不用討論,但事實上是有這種人。
j previous speech k next speech