Protocol-relative URL 是相對路徑(relative URL)的一種,以保持使用當前的協議。
如果爬蟲使用的是 Python,可以透過 urllib.parse 中的 urljoin 解決:
from urllib.parse import urljoin
base_url = "https://gnn.gamer.com.tw/"
link = "//gnn.gamer.com.tw/detail.php?sn=235918"
new_url = urljoin(base_url, link)
print(new_url)
結果為:
https://gnn.gamer.com.tw/detail.php?sn=235918