有人說,2023年是生成式AI元年,GPT聊天機器人能達到的品質大幅提升,讓許多產業紛紛引入生成式AI,希望能透過這項技術,結合自身的產業知識,碰撞出新的火花。到了現在,也就是2024年,好像還沒有一個必勝定則,讓大家能使用生成式AI,透過固定的SOP來創造黃金價值。但肯定的是,聊天機器人的技術更加廣泛的被應用,背後的模型也不斷的在推陳出新,整體應用成果仍然持續成長中。因此,筆者決定在鐵人賽分享自身開發聊天機器人的經驗,介紹如何打造企業/團隊專屬知識庫,並透過問答方式直接取得答案,來節省成員們大量查找與詢問的時間。文章會盡量以白話的方式說明,適合想了解聊天機器人的所有人,希望讀者無論是使用者或者開發者都能有不同的收穫。
系列文的前半段,將以Azure提供的資源為例,由筆者過去的開發經驗來分享問答式聊天機器人背後的運作原理,不會有實際的實作,而是介紹整體架構並簡介對應的Azure服務。
系列文的後半段,將延續前述提到的聊天機器人架構(包含RAG和LLM),在不使用付費服務的情況下,改為採用開源資源,在個人電腦(本地端)實作一個專屬的聊天機器人服務。
Azure是微軟所打造的一個公有雲端服務平台,微軟在github提供了範例程式azure-search-openai-demo,如果有付費購買相關服務,可以直接在雲端平台上建立一個聊天機器人,優點是不用被個人電腦設備的條件限制,需要多少資源就在平台上取用。也不用煩惱需要自己開發背後運作的各項功能,直接使用Azure提供的多種服務,透過範例程式串接這些服務,就能快速地建立專屬的聊天機器人。
下一篇將會正式開始介紹範例程式中的架構。
這個系列文雖然已在腦中構思一段時間,但直至開賽的當天都沒有撰寫任何的儲備文章,而且後半段的實作,也尚在評估階段,預計會在鐵人賽的30天中,實作出自己也沒做過的零費用聊天機器人。文章的輸出和限時實作的併行會是筆者給自己的一個挑戰,但相信在網路上眾多資源的支持下,這是個很有機會達成的目標。實作和文章內文都是相對即時地產出,歡迎各位同儕先進們留言分享任何心得或建議,也許能透過討論,和大家共同完成這個系列文挑戰。