剛當AI工程師兩年,希望將自己兩年來所學記錄下來,並且能幫助到剛升到研究所的學弟妹。
本挑戰預計帶給大家:
1. 以pytorch lightning 框架寫出一個屬於自己的model
2. 資料缺乏,如何利用爬蟲收集音檔文字...
3. fastapi + docker deploy
前情提要: 昨天基本上已經把Demucs model的部分完成的70%,基本上只一點而已。 skip connections參考: https://medium...
前情提要: 我們已將Demucs的model大致上完成了,基本上基礎架構就這樣,之後有些架構是將某個部分換掉而已。 當中的bottleneck用lstm,以那篇...
前情提要: 昨天分享了最近我關注的github,每個領域都有,可以找自己有興趣的研究研究。 今天剛好看到這個 https://github.com/Lightn...
前情提要: 昨天剛好看到LitServer,就想說來試試看,實際的架構確實很乾淨,但需要熟悉一下。 1. Bert server.py 這裡我參照官方範例,改了...
前情提要: 昨天有利用LitServe將bert model架起來使用,以及測試檔案上傳的部分。 補上 bert 參考: https://leemeng.tw/...
前情提要: 昨天嘗試使用LitServe部屬自己的model,看起來蠻正常的。 加上昨天花了點時間研究了官方docs,發現更多更好的寫法,以及如何測試bench...
前情提要: 昨天透過umap將bert embedding做圖示化,這種模型都是經過大量資料訓練而來,才會有這麼好的效果。 昨天提到了文字方面的模型,今天來提提...
前情提要: 昨天講了語音相關的pre-trained model,以及可以應用的場景。 今天我們來提提模型蒸餾(model distillation),蒸餾的目...
前情提要: 昨天稍微提到了模型蒸餾的概念,目的就是為了壓縮模型的大小增加速度。 今天來提提Finetune及一些量化的東西吧。 github參考: https:...
三十天其實過的蠻快的,實習的學弟妹現在都去交大開學上課了 哈哈,當初寫這系列其實是為了能教他們些東西,不過我並不知道他們看到第幾篇,只是每天都把文章寫完,他們有...