Yotsuba 這個名字取自日本動畫《五等分の花嫁》裡面的角色中野四葉。
從那之後在網路上,任何需要暱稱的地方,我都以這個名字出現,包括來參加鐵人賽。
筆者的經歷比較坎坷一些,因為很排斥唸書,所以把自己搞到高中沒有畢業。
上了大學之後,一開始我並沒有任何資訊背景。只是在某一天一時興起突然想要學寫程式,就在書局買了第一本書,之後開始自學程式。
大學時期我經常翹課,理由是我很不願意準時出現在課堂上,並且坐著好好聽課。
比起上課,我更喜歡自己一個人躲在房間使用電腦,做一些自己有興趣的研究項目,然後把研究心得分享回網路上。
我在大學分別唸過工業設計、旅遊與休閒系,以及資工系。即使最後一個科系是我喜歡的,但最後我卻選擇退學了。
一年轉系一次,到最後卻以退學告終,多麼戲劇化般的人生 ...
初學程式早期,我做過爐石戰記的牌組擴充器,我叫它 DecksPro。
因為爐石戰記的牌組有最大上限,但是牌組可以被一串代碼表示,這使得抄牌組或讓牌組復原不是難事。
當時我就想到,可以利用這個特點,做一個圖形化程式,負責幫忙紀錄這些代碼。
相隔大約三個月,我做了一個 自定義 Discord 遊戲狀態 的程式。
當時我覺得很酷 ! Discord 居然會偵測你正在遊玩的遊戲,然後做為你的個人狀態。
而且這個東西可以寫程式來自訂,Discord 有提供包好的函式庫可以使用。
當時把程式做好之後,分享到巴哈姆特的場外休憩區,並且上了精華文。
2019 年的時候,我因為打工的關係,下班時常常因為懶惰,就直接外帶麥當勞回家。
當時我甚至會根據麥當勞報報的抽獎結果來決定晚餐要不要吃麥當勞。
結果事情越來越往奇怪的地方發展,我又多申請了兩隻帳號,每天手動幫三隻帳號抽獎,看看能不能拿到喜歡的優惠。
最後我又覺得好麻煩,我為什麼不寫程式自動抽獎呢 ? 我是從那時候開始,踏入網路爬蟲這個無盡深淵。
時間軸跳轉到現在,我大約自學了四年左右的程式。
前半段的時間我幾乎什麼都碰,後半段的時間比較專注於網頁後端開發、Docker 和 Kubernetes 的技術。
主要我還是因為對網路爬蟲這個主題比較有把握一些。
來參加鐵人賽還有一個更大的動機,就是我想以深入且豐富充實的內容完賽獲獎,然後獲得出版書籍的機會。
筆者希望自己的創作能被更多人看到,同時可以幫助更多學習者,或者同為對技術感興趣的族群。
出書可以更大幅度的完成我的目標,但即使沒有成功,我的文章也會一直留在 2022 的鐵人賽,也算是心滿意足。
Day 18 你知道 Twitter 影片也是 M3U8 協定嗎 ? Twitter 影片下載器實作
Day 19 Instagram 圖片與影片下載器實作
Day 20 如何讓 Python 模仿自己說話 ? Discord 傳訊息程式實作
Day 21 risu.io 禁止網頁開發者工具 ? 那我只好從網頁的上游節點撈封包了
Day 22 爬蟲所見不即所得 ? Selenium 與 requests 的差異
Day 23 幾種程式語言實作爬蟲的差異
Day 24 利用 mitmproxy 和 mastermind 來加速爬蟲專案的開發
Day 25 什麼是 API ? 如果對方網站有提供 API,我們會輕鬆許多
Day 26 AJAX 請求與封包鑑識心法
Day 27 爬蟲與資安
Day 28 爬蟲的道德議題
Day 29 反爬蟲機制
Day 30 致謝
我花了蠻多時間在目錄的規劃,讓讀者可以提早知道我未來會發表的內容。
每次完成一篇文章,我也會回到這裡,幫目錄補上超連結。
前面幾天的文章,主要面向那些完全沒有接觸過爬蟲的人,已經對爬蟲有了解的人,也可以當作對基礎的複習。
月中會進入我想討論的重點 mitmproxy,我會把我所知道的一切全部分享出來,並且分享一些我做過的專案。
接近月底時,我會分享任何和爬蟲有關的知識點。即使我在每篇文章都會盡量去無限伸展我所知道的議題,但還是有許多議題需要另開篇幅來討論。