2006年10月31日

網頁資料擷取 website data extraction

怎樣把網頁裡的資料擷取出來 轉成XML, HTML, RSS, JSON, etc?
比如說 把交友網站裡面妹妹的資料都蒐集起來?
把成人網站裡的照片都蒐集出來?
把ebay裡面的data都extract出來做data mining?

use Screen Scraper to scrap it?
你可以試試看給firefox用的Piggy Bank + Solvent

不過呢 我覺得我還是喜歡 Dapp it!
因為不用用我的CPU 不用用我的頻寬

PS:上面這兩個都有個共通點我非常欣賞
就是 做出來的東西 都可以直接share出來讓大家用
尤其是dappit 讚!還可以直接table join在一起

沒有留言: