iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
生成式 AI

智慧旅遊顧問--結合 LLM 與 RAG 架構的台灣旅遊資訊助手 系列

使用 LLM 作為核心,結合RAG技術,從台灣旅遊資料庫中提取資訊。透過 Function Calling 串接即時天氣、交通 API,提供使用者個人化的旅遊建議與行程規劃

參賽天數 21 天 | 共 21 篇文章 | 0 人訂閱 訂閱系列文 RSS系列文
DAY 1

【Day1】我的目標與AI技術

一、目標 這次鐵人賽,我的最終目標是製作一個能夠提供使用者查詢即時旅遊建議的網站。選擇這個主題原因且聽我娓娓道來,相信許多人都有過這樣的經驗:在規劃一趟旅行時,...

2025-09-15 ‧ 由 terrylin0505 分享
DAY 2

【Day2】建置開發環境

一、前言 開發環境對於軟體的意義就像房子跟地基一樣,如果地基挖得不夠深材料用的不好會影響之後房子的品質。因此建置一個穩定、高效的開發環境是非常重要的,第二天我們...

2025-09-16 ‧ 由 terrylin0505 分享
DAY 3

【Day3】認識 FAISS 向量資料庫

一、為什麼要使用FAISS向量資料庫 傳統的資料庫擅長處理結構化的表格資料,你可以根據精確的關鍵字來查詢。但對於旅遊這樣充滿描述性文字、 需要理解語意和上下...

2025-09-17 ‧ 由 terrylin0505 分享
DAY 4

【Day4】資料的來源:從台灣政府公開資料集獲取旅遊資訊

政府公開資料集提供了大量經過整理、結構化的資訊,這些資料通常以XML或CSV格式釋出,具有極高的可靠性。這類資料集是建立RAG知識庫的絕佳起點,能為我的AI顧問...

2025-09-18 ‧ 由 terrylin0505 分享
DAY 5

【Day5】資料集加工

政府公開資料集的資料通常是長篇文章或完整的描述,對於AI模型的短時記憶體來說,一次處理這麼多資訊是非常困難的。所以我們要將這些原始資料進行加工,轉成AI能夠利用...

2025-09-19 ‧ 由 terrylin0505 分享
DAY 6

【Day6】資料的向量化

一、向量化的目的 簡單來說就是將文字轉換成高維度的數字序列-向量。這串數字序列會捕捉文字的語義,讓意義相近的文字擁有相似的數字序列。 二、如何進行向量化 使用H...

2025-09-20 ‧ 由 terrylin0505 分享
DAY 7

【Day7】串連 RAG:結合FAISS與嵌入模型

一、FAISS-為RAG而生的極速索引 FAISS的強大之處在於它的高效搜尋演算法。它可以在一瞬間,從龐大的資料海中找出你需要的資訊,這對於製作一個反應快速的A...

2025-09-21 ‧ 由 terrylin0505 分享
DAY 8

【Day8】認識 Gemma 3B IT 模型

經過前面七天的準備,我的專案已經擁有了強大的檢索能力,能夠從龐大的旅遊知識庫中,快速且精準地找到最相關的資訊。但要將這些資訊轉化為流暢、自然且符合需求的對話,我...

2025-09-22 ‧ 由 terrylin0505 分享
DAY 9

【Day9】什麼是LoRA?

LoRA-客製化屬於你的AI 昨天介紹的Google Gemma 3B 1T 模型雖然擁有卓越的通用能力,但它並沒有針對我們的台灣旅遊資訊進行訓練。直接使用它來...

2025-09-23 ‧ 由 terrylin0505 分享
DAY 10

【Day10】訓練的起點:準備資料集並設定訓練參數

AI訓練的關鍵在於提供高品質的問答對 (QA Pairs)。手動編寫將會耗費大量時間,因此我會利用FAISS知識庫和大型語言模型 (LLM),來自動化這個過程。...

2025-09-24 ‧ 由 terrylin0505 分享