0

如何下載網頁中的PDF

匿名 6 年前11278 瀏覽

有一個網頁,把使用手冊分成數個讓人下載。
但是,他不是直接連結到.pdf,而是先連到一個網頁,然後再用JAVA的語法連結到實際的檔案位置。
請問,我想藉由工具一次下載,該如何做?

海綿寶寶 iT邦超人 1 級 ‧ 6 年前 檢舉
有些網頁這樣做的目的
就是不想讓人「藉由工具一次下載」

可否貼出網頁的超連結?
nikwu43 iT邦好手 1 級 ‧ 6 年前 檢舉
antijava提到:
可否貼出網頁的超連結?

+1
參與討論,登入發表討論

1 個回答

4
逮丸逮丸
iT邦大師 1 級 ‧ 6 年前
最佳解答

然後再用JAVA的語法連結

需確認一下,是 Java Applet?還是 JavaScript?
一、如果是用 JavaScript 的話,
0.觀察真正URL的方式:
0.1 FireFox 可用 Live HTTP Headers 套件,
觀察連某頁 PDF 時的真正網址為何。
0.2 看HTML的原始碼,追一下各連結的 JavaScript 的碼,可知道各頁 query 何處。
1.如果是以「流水序號」的方式為各頁 PDF 檔命名的話,
就有可能預測每一頁PDF的URL為何,
而預先建立好各連結,然後下載下來。
2.如果是以「亂序數字英文」所組的檔名,
就無法用 1. 的方式進行。
3.如果該網站點各頁PDF時,有做cookie的檢查動作,
就必須記住該有效的cookie,
然後每一次抓各頁PDF時,也送出此有效cookie,
該網站才會視為同一個session,才讓您抓。
這可利用 wget 或 curl 來進行。

二、如果是用 Java Applet 的方式,
其下載的網址,瀏覽器應該偵測不到。

目前尚未有邦友參與回應,登入發表回應

我要發表回答

立即登入回答