看到心儀的目標想要更近一步瞭解對方
這時候我們可以善用Google
來搜尋心中殷切盼望的女神
瞭解對方後才能具體策劃進攻的方式
搶得先機早日滲透入侵對方的心
Google搜尋引擎會利用網路蜘蛛來遊走網頁
為了能增加平時查詢及檢閱速度
會下載頁面到資料庫中存放
可以用簡單的方法查找到機敏資料甚至是原始碼
可預期搜尋的網頁名稱與路徑
c:\inetpub\wwwroot
/usr/local/apache
基本語法與關鍵字
利用Index of /backup
在google上搜尋到的內容
可查看該組織的備份頁面
預防方法:網站應設定攀爬管制
可變更採用不易識別的名稱或路徑
於網頁的HEAD區段中,添加下列標籤:
<META NAME=“ROBOTS” CONTENT=“NOINDEX”>
<META NAME=“ROBOTS” CONTENT=“NOARCHIVE”>
<META NAME=“ROBOTS” CONTENT=“NOFOLLOW”>
<META NAME=“ROBOTS”CONTENT=“NOINDEX,NOFOLLOW”>
建立純文字檔robots.txt存放於網站的根目錄,聲明該網站中不願被robot攀爬的範圍。
User-agent
:填入搜尋引擎蜘蛛的值(* 號代表全部)Disallow
:填入你希望搜尋引擎別檢索的頁面路徑Allow
:若你禁止檢索的頁面路徑裡面又有特定路徑你希望搜尋引擎檢索robots.txt
檔案是否封鎖了Google的網路檢索器,使其無法檢索網站上的特定網址。