現在的問題就如同你剛剛說的,很多這些 YouTube 影片的提供者等等,他其實根本也不知道,也無從參與它被這樣子訓練出來了。所以,如果中間因為他參與的部分產生了偏見或幻覺或怎麼樣的話,其實他也沒有辦法知道。現在也有很多研究,像微軟的那個 Phi 模型顯示,其實你如果一開始就專門為了機器學習而主動提供這種極高品質的資料,在那個應用場域裡面,它有的時候在模型很小的時候,還是可以展現出不遜於大模型,或甚至比大模型更好的這些做法。就是因為它資料的精緻度非常的高這樣。