iT邦幫忙

0

如何下載網頁中的PDF

匿名 2010-07-26 17:17:0123505 瀏覽
  • 分享至 

  • xImage

有一個網頁,把使用手冊分成數個讓人下載。
但是,他不是直接連結到.pdf,而是先連到一個網頁,然後再用JAVA的語法連結到實際的檔案位置。
請問,我想藉由工具一次下載,該如何做?

有些網頁這樣做的目的
就是不想讓人「藉由工具一次下載」

可否貼出網頁的超連結?
nikwu43 iT邦好手 1 級 ‧ 2010-07-26 20:51:34 檢舉
antijava提到:
可否貼出網頁的超連結?

+1
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

4
逮丸逮丸
iT邦大師 1 級 ‧ 2010-07-27 09:24:52
最佳解答

然後再用JAVA的語法連結

需確認一下,是 Java Applet?還是 JavaScript?
一、如果是用 JavaScript 的話,
0.觀察真正URL的方式:
0.1 FireFox 可用 Live HTTP Headers 套件,
觀察連某頁 PDF 時的真正網址為何。
0.2 看HTML的原始碼,追一下各連結的 JavaScript 的碼,可知道各頁 query 何處。
1.如果是以「流水序號」的方式為各頁 PDF 檔命名的話,
就有可能預測每一頁PDF的URL為何,
而預先建立好各連結,然後下載下來。
2.如果是以「亂序數字英文」所組的檔名,
就無法用 1. 的方式進行。
3.如果該網站點各頁PDF時,有做cookie的檢查動作,
就必須記住該有效的cookie,
然後每一次抓各頁PDF時,也送出此有效cookie,
該網站才會視為同一個session,才讓您抓。
這可利用 wget 或 curl 來進行。

二、如果是用 Java Applet 的方式,
其下載的網址,瀏覽器應該偵測不到。

我要發表回答

立即登入回答