當一個資料表包含的欄位有姓名、年齡、性別、住所、宗教等等,如果把姓名用X等,都會發現同一個顏色的紀錄都會有兩筆以上,第一筆與第三筆是一模一樣等,這樣的狀況我們就會稱這樣的集合是符合K等於2的狀態。換句話說,當資料經過這樣的處理之後,因為有兩筆的紀錄是一模一樣,所以無法指定到特定的個人,猜測到的機率是1/2。換句話說,如果要達到K等於22的目標,我就是把我的資料經過處理之後經過分群,最少的那一群是22,就可以達到K等於22的目的。
j previous speech k next speech