對,根本不是去識別化,而是統計,去識別化還是你有10萬筆,我就10萬,只是拿掉可識別的資訊,以我們的理解,其實大部分的學者是希望把一套統計演算法,直接交給機關、財資中心,然後可以請白帽駭客證明這個東西是不會洩漏個資的,就是一套統計演算法,只是比財政部那個分層所得、分位,把離群值去掉,以至於平均數都是錯的——這一段逐字稿可能要改一下(笑)——的那一個統計演算法要好,所以民間提供更好的統計演算法,但是還是持有資料機關來執行,執行完之後還是統計資料,所以還是出去,裡面是不包含個資的。
j previous speech k next speech