關於我自己

我的相片
New York, New York, United States
我叫江奕賢啦

2006年10月31日

網頁資料擷取 website data extraction

怎樣把網頁裡的資料擷取出來 轉成XML, HTML, RSS, JSON, etc?
比如說 把交友網站裡面妹妹的資料都蒐集起來?
把成人網站裡的照片都蒐集出來?
把ebay裡面的data都extract出來做data mining?

use Screen Scraper to scrap it?
你可以試試看給firefox用的Piggy Bank + Solvent

不過呢 我覺得我還是喜歡 Dapp it!
因為不用用我的CPU 不用用我的頻寬

PS:上面這兩個都有個共通點我非常欣賞
就是 做出來的東西 都可以直接share出來讓大家用
尤其是dappit 讚!還可以直接table join在一起

沒有留言: