iT邦幫忙

0

網路爬蟲能不能直接爬蟲本機目錄下面的網頁?

  • 分享至 

  • xImage

我最近在做網路爬蟲,我要爬本機的內部網頁,是在C:\底下,我是用C#寫的,我直接把目錄貼上去不行,會發生錯誤。我就是用HtmlAgilityPack正常的方法做爬蟲的。

string url = "C:/Tung/%E6%8D%89%E5%AD%97%E8%A9%9E/%E9%A0%90%E8%AD%A6%E4%BA%8B%E4%BB%B6%E7%B5%B1%E8%A8%88%E8%A1%A8_01.html";

HtmlWeb web = new HtmlWeb();

HtmlDocument doc = web.Load(url);

程式就錯在第三行 HtmlDocument doc = web.Load(url); 請問有沒有辦法改呢?還是本機的網頁都不能爬蟲?謝謝

淺水員 iT邦大師 6 級 ‧ 2022-05-13 14:45:21 檢舉
同一台機器不是直接用開啟檔案的方式就可以了?
DennisLu iT邦研究生 1 級 ‧ 2022-05-13 15:44:58 檢舉
不用,直接讀檔案接上爬到讀取資料分析那段就好
baltic iT邦新手 4 級 ‧ 2022-05-13 15:48:29 檢舉
解決了,網址裡面改成原始中文就好了
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

3
海綿寶寶
iT邦大神 1 級 ‧ 2022-05-13 15:19:29

參考這篇

var path = @"C:/Tung/%E6%8D%89%E5%AD%97%E8%A9%9E/%E9%A0%90%E8%AD%A6%E4%BA%8B%E4%BB%B6%E7%B5%B1%E8%A8%88%E8%A1%A8_01.html";
		
var doc = new HtmlDocument();
doc.Load(path);

我要發表回答

立即登入回答