iT邦幫忙

iT 邦幫忙聊天室

加入聊天室談甘苦論八卦
WilliamHuang 2017-12-11 08:41:07

/images/emoticon/emoticon35.gif

小魚 2017-12-10 11:50:38

恩,
我想那大概不是爬蟲了,
應該要叫駭客了。
(正確說法應該是劊客Cracker)

Howard 2017-12-10 11:39:55

小魚爬蟲還有個前提
那就是你看得到,才有可能爬得到

Howard 2017-12-10 11:39:17

fysh711426當然可以的,這個常做
但這種倒是沒辦法拿來放在鐵人賽裡面

小魚 2017-12-10 10:50:25

小財神
問一個Markdown的問題,
我在Markdown的說明裡面好像沒看到顏色的部分,
因為想要把某一段變色來做一些區分,
這樣是可以做到的嗎?

小魚 2017-12-10 10:48:50

可以爬中央情報局的情報嗎?
/images/emoticon/emoticon05.gif

fysh711426 2017-12-10 10:46:07

可以爬小說,爬某些論壇的圖片
/images/emoticon/emoticon39.gif

小魚 2017-12-09 19:50:33

終於把30天的題目都訂出來了,
找個黃道吉日再開始發鐵人文吧
/images/emoticon/emoticon39.gif

Howard 2017-12-08 21:12:49
Howard 2017-12-08 21:12:34

小魚 我針對台彩那頁寫了一篇小插曲,基本上是可以抓成功的

runan5678 2017-12-08 16:44:26

魷魚 依照您的說法大概要先解決各系統的驗證方式,像是form auth或basic auth,之後就看要爬甚麼資料再慢慢收了

小魚 2017-12-08 12:52:19

爬一下台彩的網頁吧,
就爬銷售地點那一頁,
這部份我沒有爬成功...

Howard 2017-12-08 11:06:28

@魷魚 這個很簡單,basic auth 放 header 就可以了,

魷魚 2017-12-08 11:01:39

我自己在玩的應該是cookie就可以解決,像是要連到wifi分享器去看,現在有誰連線這樣
進去分享器前,會先做身分驗證,像是這樣~
https://ithelp.ithome.com.tw/upload/images/20171208/20103350HKofNgWFtQ.jpg

Howard 2017-12-08 10:32:23

魷魚 當然沒問題呀,我的下一篇會包含到 cookie 的部分,最單純的驗證方式,但很多網站會有額外的機制,你那邊有要爬的網站的範例嗎?

魷魚 2017-12-08 10:17:03

@Howard 最近也在研究爬蟲,每天都要連去個主機觀察一些log資料,目標是把散落在各主機的Web資料利用爬蟲爬出來,統一整理再一個網頁裡。這樣可以不用每天連到一堆主機看資料,可以弄一個資訊平台:D
但目前有點卡住,各主機的Web會先做身分驗證,看看大大能不能寫一些範例或介紹/images/emoticon/emoticon07.gif

Howard 2017-12-08 09:51:44

炎之虛空跟虎大論壇那邊的炎之虛空是同一個人嗎??

Howard 2017-12-08 09:49:28

鐵人賽我寫爬蟲,有沒有什麼好的 idea 想玩玩的
/images/emoticon/emoticon58.gif

WilliamHuang 2017-12-06 23:20:48

/images/emoticon/emoticon35.gif

Fu-sheng 2017-12-06 20:41:16

/images/emoticon/emoticon01.gif