iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
AI & Data

打造你的數位圖書館:從雜亂檔案到個人化知識庫 系列

海量的上課講義、多的像山的考古題、劃不完的考試重點,我將使用Python來整理大量的 PDF 檔案,讓檔案不再躺在資料夾裡吃灰。

參賽天數 26 天 | 共 26 篇文章 | 1 人訂閱 訂閱系列文 RSS系列文
DAY 1

DAY1 - 前言

▍前言 為什麼會選擇這個主題?因為每次想從講義裡找需要的部分都很花時間,也不見得找到的是我真正想要的,而且在複習的時候也不好確定自己到底是不是真的會了。所以我想...

2025-09-15 ‧ 由 shaix0 分享
DAY 2

DAY2 - 題庫建立

建立題庫前,需要先處理題目的原檔,把需要的部份都提取出來。除了基本的題目、選項和答案之外,把題目提供的來源書籍替換掉符號,再和額外的資訊一併拆出。因為這次只會處...

2025-09-16 ‧ 由 shaix0 分享
DAY 3

DAY3 - 前端串接

昨天成功把題庫處理好了,今天做一個簡單的搜尋頁面來試試看。考慮到之後要整合AI,我選擇使用Flask框架來製作,工具選用visual studio。這裡選的是帶...

2025-09-17 ‧ 由 shaix0 分享
DAY 4

DAY4 - 去除重複題目

昨天我們測試過最基本的搜尋功能沒問題,但是多測試幾次後發現,有時候會出現很多個一樣的題目,是轉換出錯了?還是題目重複出現了?在轉換pdf的時候,已經加入一些條件...

2025-09-18 ‧ 由 shaix0 分享
DAY 5

DAY5 - 題目詳情&切換答案顯示

今天稍微優化一些前端,再加上題目詳情(來源檔案、書籍)和切換答案顯示的功能。 ▍程式碼 修改views.py,加入題目詳情需要的資訊 <h5>搜...

2025-09-19 ‧ 由 shaix0 分享
DAY 6

DAY6 - AI標籤生成

為什麼要給題目加上標籤?因為在複習時,我們不一定能記得所有的題目、專有名詞,但是給題目加上標籤後,我們就可以以標籤來做為搜尋條件,快速找到相關題目。標籤還能用來...

2025-09-20 ‧ 由 shaix0 分享
DAY 7

DAY7 - 標籤搜尋

昨天成功給題目加上標籤作為分類依據,今天讓加上的標籤可以做為搜尋條件。 ▍程式碼 先給前端加上下拉選單 <!-- index.html -->...

2025-09-21 ‧ 由 shaix0 分享
DAY 8

DAY8 - 進階搜尋

昨天我們成功的加入了標籤搜尋,我希望搜尋時可以有更多篩選條件,更精確的找到符合條件的題目,今天試著給關鍵字搜尋加上來源書籍作為篩選條件。 ▍程式碼 前端加上下...

2025-09-22 ‧ 由 shaix0 分享
DAY 9

DAY9 - 題目向量化

在關鍵字搜尋中,系統只會單純的查找題目和答案中有沒有包含關鍵字,但我希望可以搜尋到和這個關鍵字相關的內容,並且依照相關度來排序。那這又有了另一個問題,要怎麼判斷...

2025-09-23 ‧ 由 shaix0 分享
DAY 10

DAY10 - 向量搜尋

昨天我們已經先把題目的向量生出來了,今天來正式加入向量搜尋。 ▍程式碼 將搜尋改為呼叫向量搜尋函式 # views.py @app.route('/sea...

2025-09-24 ‧ 由 shaix0 分享