所謂的強化學習意思,AI 系統做出一個判斷的時候,像下棋下贏或者是下輸,當然會回想是下那一步棋,讓自己下贏或者是下輸等等,其實人類也是一樣,你如果下五子棋或者是西洋棋,就會去回想是哪一步下錯了,才會導致輸掉的結果等等,這個就是自己腦裡會有一套獎懲系統,也就是下棋的時候,並不會每一次、每步,老師都來跟你說下這邊會更好、下那邊更好,很多時候是你下完或者是玩電動遊戲,事後因為這一盤輸得比較早或者是得分比較低,就去想哪裡做錯、可以改一下策略等等,所以強化學習的意思,告訴這個 AI 系統是哪一些表現好,就會去強化系統裡那一些的神經,然後如果哪一些表現不好,就會弱化這些部分的神經,大概就跟人類學習是類似的意思。