今天進行的是實作的第一步——蒐集樣本。
我找了幾封常見的釣魚郵件範例,例如:
「你的包裹無法派送,請點擊連結確認資料」
「你的銀行帳號出現異常登入,請立即驗證」
「恭喜中獎!請填寫個人資料領取」
這些郵件的共同特徵非常明顯:
1.急迫語氣(強調「立即」、「限時」、「最後通知」)
2.陌生寄件人或可疑網域
3.夾帶不明連結或附件
這些郵件雖然看似日常,但都有明顯的可疑特徵,例如使用急迫語氣(強調「立即」、「限時」、「最後通知」)、來自陌生寄件人或不明網域,並夾帶可疑的連結或附件。這些特徵正是 AI 模型可以學習辨識的線索。
為了讓訓練更有參考價值,我準備了幾封正常郵件作為對照組,例如學校通知、公司簡報邀請、或服務更新信件。透過比對兩者的語氣、格式與連結模式,AI 將能學習出釣魚郵件的潛在規律。接下來,我會進入資料前處理階段,讓這些樣本能被模型有效分析。