iT邦幫忙

0

請問一下C#爬蟲有辦法抓到Flash裡面的內容嗎?

想請問一下,
最近有個需求,
要去抓Flash的內容,
不過我的印象中只能抓到Html的內容而已,
我想問一下C#有辦法抓到Flash裡面的文字圖片之類的嗎?

看更多先前的討論...收起先前的討論...
orzzro iT邦新手 5 級 ‧ 2017-07-14 10:41:20 檢舉
不行吧 Flash 的SWF 是封裝的 固定在SWF 是無法在線上WEB 取得
但你可以看他FLASH 裡的這些文字或圖片是否是從外部來源來
如果 就看連哪裡的API 取得這些資料 就可以拿到了
fillano iT邦超人 1 級 ‧ 2017-07-14 13:47:17 檢舉
抓到swf檔以後,會需要有swf parser來剖析。swf格式是公開標準,應該不難找到現成的剖析器。之前用過這個:http://www.flagstonesoftware.com/transform/
fillano iT邦超人 1 級 ‧ 2017-07-14 14:08:34 檢舉
如果想自己寫parser,可以參考:http://www.adobe.com/devnet/swf.html
swf是一種frame base的檔案格式,各種資源會包在不同種的frame裡面交錯放置,這樣可以讓資源串流化,但是剖析會比較麻煩,需要把各種不同的frame各自收集起來,才能抓出個別的資源。
小魚 iT邦新手 2 級 ‧ 2017-07-14 19:15:45 檢舉
恩恩,那我試試看
感恩~

2 個回答

2
dog830228
iT邦新手 1 級 ‧ 2017-07-14 09:24:48

可以
你把你抓到的Html內容 做正規表示法取出Img標籤

string regular = "<img.+?src=\"(?<imgsrc>.+?)\"";

取得圖片網址後
就可用webclient下載 圖片

可以參考

0
orzzro
iT邦新手 5 級 ‧ 2017-07-14 10:41:50

不行吧 Flash 的SWF 是封裝的 固定在SWF 是無法在線上WEB 取得
但你可以看他FLASH 裡的這些文字或圖片是否是從外部來源來
如果 就看連哪裡的API 取得這些資料 就可以拿到了

我要發表回答

立即登入回答