iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 2
0
Security

機器學習在計算機安全上的練習題系列 第 2

主題1 :CAPTCHA

今天來學習

  • CAPTCHA(Completely Automated Public Turing Test to Tell Computers and Humans Apart)[註1]
  • reCAPTCHA [註2]
  • noCAPTHCA reCAPTCHA [註3]

基本上這是一個 OCR[註4] 的問題,各位在刷票、作爬蟲的時候應該也處理過相關議題。我是看 wiki 才知道原來有下面這回事…

根據CAPTCHA測試的定義,產生驗證碼圖片的演算法必須公開,即使該演算法可能有專利保護。這樣做是證明想破解就需要解決一個不同的人工智慧難題,而非僅靠發現原來的(秘密)演算法…

這個主題出現在實戰的第五章,結果只是用 mnist data set 做完手寫字辨識就算一個章節了 XDDDDD,這我們昨天就做過了,baseline 準確率也有個 99.09%...

我找到合適的開放資料集再來寫 lab 吧

值得一提的是驗證碼之父,也是 Duolingo 創辦人, Luis von Ahn,這位 CMU 教授的故事相當值得一看[註5]

  1. 驗證碼 - 維基百科,自由的百科全書
  2. reCAPTCHA - 維基百科,自由的百科全書
  3. Google釋出新版reCAPTCHA機制,只要點「我不是機器人」! | iThome
  4. 光學字元辨識 - 維基百科,自由的百科全書
  5. reCAPTCHA: The Genius Who's Tricking the World Into Doing His Work

上一篇
lab 0: 使用 Google Colab 玩機器學習/深度學習
下一篇
topic 2: 惡意評論分辨-1
系列文
機器學習在計算機安全上的練習題3
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言