去識別化就不好用了,財政部去識別化有一次公開的情況,有一個地區叫做最小統計區,每個人有不同的收入,可以作一些分析,包括人口的遷移,又要保障隱私,如果是最高的百分位,而其他人都不是,你就知道是誰了,他就把這一筆拿掉,但是你算中位數、平均值或者是什麼都是錯的,因為資料拿掉,所以按照目前對於個人資料的保護,對於任何一筆,都只有1/K的機率才真的猜中才知道是誰,K真的要滿大的,以財政部的例子是20%,如果那個地方只有一個人,所以是百分之百,那就要拿掉,因此這個時候就要拿掉,找不到其他的人有類似的情況。
j previous speech k next speech