這個是實作案例:狀況2。讓為了實作資料比較高的可用性,我們讓比較多的欄位納進來處理,包含了戶籍地址、所得總額、所得凈額、應納稅額,也包含了撫養人數、扣除額人數。概化處理方式是用村里來處理,所得總額的方式是以10等分位組來處理。同時我們計算所得凈額及應納稅額音高度相關於所得總額,相關係數也到0.99及0.97,所以在處理的當中我們只針對所得總額來計算。所得凈額跟應納稅額也是用10等分位組,低度間接概化,我們是用低密度來處理。可以發現這樣的數據還滿ok的,不符合K等於22的資料不占3%左右。
j previous speech k next speech