對,它很容易被突破心防,本來是做某件事,但是看到這個提示詞句之後,就突然間跑到別的地方去了,最近甚至有論文是你給他一些特定的關鍵詞,有點像是催眠一樣,你就可以叫他做任何事,不管本來是被設定成只能做什麼,所以這個叫做「adversarial prompt」,就是「有敵意的提示詞」,所以這一些都是在大規模產業應用前,大家要先解決的問題。
j previous speech k next speech