iT邦幫忙

20

想要抓網站的資料嗎?試試 Dapper

介紹一個網站
http://www.dapper.net/
Dapper 是一個新的服務型態,
提供使用者自行擷取網頁資料的功能。

可以讓你用很簡單的方式進行設定,
然後將你所想要的網站資料擷取下來,
並採用你想要的格式,
包括 XML, RSS,...等等


0
john651216
iT邦研究生 1 級 ‧ 2008-04-14 17:41:20

謝謝分享

0
灌籃高手
iT邦高手 1 級 ‧ 2008-04-14 17:45:50

感謝分享,剛才試了一下,主要的功能好像是將指定網站的頁面或搜尋結果轉成結構化的資料,例如XML或RSS,不過前提應該是該網站的資料必需是規則的出現,並且有DOM可以抓,如果是手工排的網頁,可能就不一定能正確抓的到!而且目前比較新的網站或blog通常都有提供RSS,就不需要自已費力去parse網頁了!

Anyway,這個網站的介面做的很棒,值的推一下!

0
wordsmith
iT邦高手 1 級 ‧ 2008-04-14 18:21:51

我曾經用它來抓博客來的排行榜資料,結果就很慘,不是它不好用,而是博客來網頁寫得不夠結構化,最後還是要用文字去parsing,才抓得到我要的資料。
不過後來抓完沒多久,博客來就自己推排行榜的gadget,害我有點白忙一場。
這個應該要貼到每日一問去,哈哈。

0
kaptech
iT邦新手 2 級 ‧ 2008-04-14 21:35:03

好棒的功能喔!!!

0
xsenie628
iT邦新手 1 級 ‧ 2008-04-15 00:36:02

這樣就抓資料很方便囉,
謝謝你的分享

0
海綿寶寶
iT邦超人 1 級 ‧ 2008-04-18 15:40:15

這個網站還有意外的附加功能,
就是可以讓你知道
那些網站是用工具刻出來的,
而那些網頁是工程師流汗拼出來的。

通常用工具刻出來的 HTML 碼會比較工整(甚至符合 W3C),
而拚出來的網頁大都是較隨性一點,符合 Browser 就 OK 了。

0
fanylu60
iT邦研究生 1 級 ‧ 2008-04-19 14:41:49

感謝你提供的資訊,對我有幫助

0
yce701116
iT邦研究生 1 級 ‧ 2008-04-19 22:28:24

感謝分享這個資訊

0
plutosrita
iT邦研究生 1 級 ‧ 2008-05-04 10:42:11

謝謝分享

0
amber093100
iT邦研究生 1 級 ‧ 2008-05-06 20:00:17

謝謝分享

0
jennymsn
iT邦好手 10 級 ‧ 2008-05-06 20:21:31

謝謝分享此資訊

0
loripan
iT邦研究生 1 級 ‧ 2008-05-06 20:31:48

謝謝你的分享

0
funkent
iT邦高手 1 級 ‧ 2008-05-12 20:49:52

這樣就可以不用使用抓網頁的軟體了

0
jamesjan
iT邦高手 1 級 ‧ 2008-08-30 13:49:27

感謝分享

我要留言

立即登入留言