我最近在做網路爬蟲,我要爬本機的內部網頁,是在C:\底下,我是用C#寫的,我直接把目錄貼上去不行,會發生錯誤。我就是用HtmlAgilityPack正常的方法做爬蟲的。
string url = "C:/Tung/%E6%8D%89%E5%AD%97%E8%A9%9E/%E9%A0%90%E8%AD%A6%E4%BA%8B%E4%BB%B6%E7%B5%B1%E8%A8%88%E8%A1%A8_01.html";
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(url);
程式就錯在第三行 HtmlDocument doc = web.Load(url); 請問有沒有辦法改呢?還是本機的網頁都不能爬蟲?謝謝
參考這篇
var path = @"C:/Tung/%E6%8D%89%E5%AD%97%E8%A9%9E/%E9%A0%90%E8%AD%A6%E4%BA%8B%E4%BB%B6%E7%B5%B1%E8%A8%88%E8%A1%A8_01.html";
var doc = new HtmlDocument();
doc.Load(path);