所以,當他發現一個比目前能力強大的 AI 出現的時候,他也可以試圖用他的小 AI,來濫用這個大 AI。舉例來講,他以前可能是透過一對一的資訊操弄方式,去說服你趕快去買什麼虛擬資產,把錢全部都匯到他戶頭裡。他可能已經訓練出某個小模型,專門用來做資訊操弄。以前攻擊方需要至少跟你講相同的語言,而且對文化有一定的了解,才能成功說服你。現在假設他能運用某個更強的 AI、更了解你的語言跟文化,他自己和他的小 AI 雖然不會你的語言,但是透過大模型來操弄就好了。所以我們怎麼樣去偵測說,它不會被這樣子誤用?
j previous speech k next speech