Google Hacking女神搜尋技法

2021 iThome 鐵人賽

DAY 25

Security

13th鐵人賽

2154 瀏覽

看到心儀的目標想要更近一步瞭解對方
這時候我們可以善用Google
來搜尋心中殷切盼望的女神
瞭解對方後才能具體策劃進攻的方式
搶得先機早日滲透入侵對方的心

Google搜尋引擎會利用網路蜘蛛來遊走網頁
為了能增加平時查詢及檢閱速度
會下載頁面到資料庫中存放
可以用簡單的方法查找到機敏資料甚至是原始碼

可預期搜尋的網頁名稱與路徑

基本語法與關鍵字

利用Index of /backup 在google上搜尋到的內容
可查看該組織的備份頁面

預防方法：網站應設定攀爬管制

可變更採用不易識別的名稱或路徑
於網頁的HEAD區段中，添加下列標籤：
- <META NAME=“ROBOTS” CONTENT=“NOINDEX”>
  搜尋引擎不處理、不儲存這個網頁。
- <META NAME=“ROBOTS” CONTENT=“NOARCHIVE”>
  搜尋引擎處理這個網頁，但是不儲存網頁，也就是說，不會有庫存頁。
- <META NAME=“ROBOTS” CONTENT=“NOFOLLOW”>
  搜尋引擎處理這個網頁，但是不繼續處理這個網頁中另外連結的網頁。
- <META NAME=“ROBOTS”CONTENT=“NOINDEX,NOFOLLOW”>
  搜尋引擎處理、儲存這個網頁，以及這個網頁中另外連結的所有資訊。
建立純文字檔robots.txt存放於網站的根目錄，聲明該網站中不願被robot攀爬的範圍。
- User-agent：填入搜尋引擎蜘蛛的值（* 號代表全部）
- Disallow：填入你希望搜尋引擎別檢索的頁面路徑
- Allow：若你禁止檢索的頁面路徑裡面又有特定路徑你希望搜尋引擎檢索