這兩位朋友所做的事情就是把剛才所說的開放資料平台的機器可讀介面裡面每一筆資料都全部下載下去,而且已經用半自動化的方式做了資料清理跟擷取的工作。依我所知,他們並沒有做按結構化到結構化的轉換,如:PDF到Excel。但是他們有做結構化的清理,比如Big5的資料集或者是欄位有不全的地方,他們用機器自動清理比對,而且把資料格式,好比像日期格式都做的這一種規劃,你們這一種有使用嗎?或者是?
j previous speech k next speech