iT邦幫忙

2023 iThome 鐵人賽

DAY 30
0
AI & Data

AI 再次入門到進階系列 第 30

【Day30】鐵人賽總結以及這個月的展望

  • 分享至 

  • xImage
  •  

這次的鐵人賽由於沒有存稿,所以雖然能做的時間比較多了,但是還是沒有章法,做事比較是淺嘗輒止,沒有持續的創造,輸出跟產出,做的東西大多是二次加工,當初開賽時想的越美好,結束時就越發現更多不足的地方,哈哈。

明年假如還參加鐵人賽的話,大概都會提前幾個月開始存稿,確保結束時整個鐵人賽事是對一個高價值技術的深挖以及應用,每天都要有大量得理論,實作,應用以及每天都一個 Prototype。

2022年 ChatGPT 的出現不誇張的說真的讓 NLP 從 CV 的配角變成主角,在這之前雖然已經有相關的 Demo,但因為已經遠離相關的研究(雖然碩士時候做的碩論也超膚淺的,也僅僅只是水一篇論文),所以就沒有太過深入注意,甚至會覺得是不是有人在背後扮演機器人,哈哈。

我這段時間可能還是會抽空把 github 的 side project 做的稍微完整一點,這段時間做的東西感覺都還要再加強一點就是了,所以一有空可能還是要多做點事情就是了。

今年結束前工作或是專業方面預訂要完成的大概就是要完成六個專案, 再做幾個私人的side project 以及再好好當個上班族這樣 哈哈。

不過專案主要應該還是大模型的調優,訓練跟部署的相關內容是最優先的,畢竟目前工作上面用 Agent 的感覺還很少的就是了,學著就當一個自動化工具用就可以了。

其實 Agent也有局限性,你可以理解 Agent目前能做到的極限就是它能調用的大模型與寫好的script的能力的整合。

之前看別人在用機器學習在做量化交易之類的東西,不知道 BloombergGPT 出來之後又出現了什麼變化,在高頻交易那邊人類大概會完全被算法打敗的感覺。

感覺用機器學習相關的算法處理股票或相關的金融商品可能會是一個能賺小錢的 side project , 哈哈。

之後有時間的話盡可能每週都一個玩具 Demo類型的 github 項目,希望這段時間能把相關的基礎補齊就是了。

這幾天大概有時間就先試試看分布式的訓練, 可能先從pytorch 再到 PEFT 跟 DeepSpeed ,先從colab上單機跑通,再到Vast.ai(這個最低價,但沒有A100,H100),Runpod.io(這個操作很傻瓜,機器也充足,但有點貴),Coreweave(這個要人工審核,我還沒過審核), Lambda Labs(這個價格算低,但機器都被搶光了),autodl(這個是大陸那邊的,需要有那邊的支付,A100也都被搶光了), Paperspace(使用Gradient 的介面,應該類似Colab,也可以租多個gpu, 不過也有點限制), (後面這幾個我還沒試過)Vultr ,gpushare。

但對於窮人而言,還是先在colab弄出Prototype,在用最短時間在上面租兩個GPU的機器驗證是否能運行這樣比較好。

總之,像我這樣的窮人玩花錢的東西還是要算著用就是了。

最後:我目前的Blog都會在這邊:https://medium.com/@marklaik

內容主要是會是技術相關的東西。

我大概之後每年都會參加鐵人賽已督促自己不斷地學習最新的技術以及了解目前軟體方面最新的發展。

反正不斷前進就對了。

下面是感覺蠻好玩的影片,裡面的想法是可以參考的

Yes

Yes


上一篇
【Day29】 LLM Agent Toy專案階段總結以及參考連結(四)
系列文
AI 再次入門到進階30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言