時間過得很快,鐵人賽已經進入最後一週了!
前面三週,我從最簡單的GPT-2文字生成開始,到後來試過調參數、做各種NLP小應用,甚至用上Hugging Face的新模型Gemma。一路上踩過不少坑,像是模型亂接龍、中文分類跑不動、還有幻覺現象亂編故事。雖然常常被搞得哭笑不得,但也真的學到很多。
既然最後一週是收尾,我想要做一個小專案,把前面學到的東西串起來,這樣結束之後也會有一個完整的成果可以拿出來展示。
經過一番思考,我決定要做一個最簡單版本的AI問答機器人。
為什麼選「問答機器人」?
專案的基本構想
我想要的功能很簡單:
也就是說,它不是那種什麼都能回答的ChatGPT,而是偏向文件型問答,只能針對提供的文章去回答問題。
雖然只是個小工具,但我覺得能把學到的東西串成一個專案,就已經很值得。希望最後這週的成果能讓整個鐵人挑戰有個漂亮的結尾!!