這三十天的主題事實上用這個會比較適合 :
Junior AI Application Engineer 的學習指南 - 透過實作 AI 學習工具人
這三十天完全就是一個邊做邊學的狀態,本來開賽前就有一些規畫,但這寫這就全部打掉重寫了,因為每寫完一篇就就每天冒出一堆新東西,然後我的規畫就一直變,然後直到變成現在這個樣子。
我們來是想說這次就全部都些 AI Application 的理論與知識,但是又發現沒有實作整個都是一知半解,很多東西也是在實作時發現很多坑,所以建議如果在學習 AI 時,一定要理論知識與實作並重,這樣才是一個好的學習指南。
首先是關於 Framework 相關,建議不管如何都還是找一個比較好,就算不是 LangChain 也是,然後它們共有的知識,應該下面也都有包含到。
接下來是記憶相關的功能知識,主要是介紹 LangChain&LangGraph 中相關的功能,並且理解這兩個記憶功能的差別。
然後接下來是關於 Prompt Engineering 與成本相關的知識。
然後接下來這裡就是幾入到讓咱們的工具人與外界溝通的部份 :
接下來這裡就是 RAG 相關的,不過事實上這裡很多知識和實作篇混在一起了,所以這裡 RAG 才一篇,不然後應該很多。
然後在完成功能已後,接下來就是要進行我們的 AI Application Evaluation,然後我們這裡是選擇 Langfuse 來當我們的 AI Observability 然後我們這裡主要是將 Evaluation,其它如 Trace 我自已是覺得有點簡單,所以就沒放在這 30 天內來說。
最後這裡就是介紹 AI Model 了,這裡會放在最後面是因為我發現沒有前面的知識,我根本不知道那些數字與欄位代表什麼意思。
上面是知識篇,然後下面這些是邊學知識,邊將他們加到我們的 AI 學習工具人上,但是有點可惜這個最後兩個沒有完成,主要是因為篇幅不夠,而且那兩個用到的東西在前面幾篇都有,項多就只是用 Cronjob 與 Google Calendar API 之類的,所以就沒在這 30 天撰寫。
然後我自已是蠻愛研究 30-10 的功能,這篇文章中做出來的東西沒有完美,但是學習引導者
這個的發想讓我對未來的學習世界產生了更多的探索好奇心,接下來應該會繼續往這個地方研究。
然後接下來是會與外部工具進行溝通的部份,就是和我們的資料庫、第三方公具之類的,並且還有實作成 A2A Server 可以讓其它 Agent 來連。
接下來我們就要進行 RAG 相關方面的實作,這一塊我選擇的功能是問與答,後來發現這一塊真的是一個很大的坑,因為什麼情境都有可能。
最後這篇是針對我們的問與答功能來進行 Evaluation,然後寫了這篇才發覺,真的很多坑啊… 所以我才寫了一個還需研究的字樣
這 30 天內我查了很多資料,也看了很多論文,這裡簡單整理一下。
🤔 論文
論文這裡真的太多了,我就只列一些我有完整看完的幾個,然後這些都在這個網站找的,它是開源免費的,是每個要發表論文的大大,可能會先送到這裡給其它人看看的地方。
這一塊是偏 Prompt Engineering 的。
然後這一塊都是 RAG,讀下去才發現深的和海溝一樣深,之前本來覺得 RAG 不是套套 Framework 就好,後來發現我是智障。
然後這一張圖我覺得很棒,可以當 RAG 的學習圖。
圖片來源: Retrieval-Augmented Generation for Large Language Models: A Survey
🤔 AI Protocol
目前 AI 世界應該是最常聽也常看到的 Protocol,也是必學。
🤔 學習網站
我自已覺得目前最大的幾個 AI 供應商的文件都一定要看,看完你自已就會抓出他們大部份共同的地方與特別的地方。
接下來 Framework 的當然也要,然後也不要只看你有用的,其它的我自已也覺得可以參考,有些觀念與說明也不錯,真的可以幫助你在看某個 Framwork 卡關時,另一個就有寫。
然後還有指標類與 AI Observability 的,其中第三篇的比較我覺得寫的很棒,也讓我知道不是只有最常見的 Ragas 與缺點,可惜篇幅不多,沒辦法多寫一些。
然後接下來這個是非常棒的 Prompt Engineering 網站,我大部份的 Prompt 知識都從這來。
最後我覺得 ihower 的 AI 電子報與陳縕儂教授的 NTU MiuLab真的給我很多幫助,讓我知道了很多東西,而且也常收集新知識,所以我想特別的推推。
對了實作程式碼之後在公布到我的 medium,要整理一下,有點亂。
https://medium.com/@marklin.coffee.pro