iT邦幫忙

2025 iThome 鐵人賽

DAY 17
0
生成式 AI

生成式 AI 30 天觀念導讀:不寫程式也看懂的實戰思維系列 第 17

Day 17|Re-ranking 與組合檢索:先找得到,再找得準

  • 分享至 

  • xImage
  •  

為什麼需要談?
第一輪召回像撒網,第二輪重排才是挑魚。沒有重排,Top-1 常常「很像但不對題」。

白話定義
Re-ranking=用更精準的模型或規則,對候選段落做「第二次排序」。

常見情境
跨主題文件、同詞多義(「限制」是法規限制還是硬體限制?)、問句模糊、跨部門術語差異。

常見誤解

「Top-k 夠了」→ 可能全是敘事段,沒有關鍵證據。

「語意最高就第一」→ 真正要找的是能支持結論的證據段。

實用心法

兩段式:大範圍召回(語意+關鍵字+規則)→ 小範圍重排(定義/數字/條號/標題相符加分)。

證據優先:含「定義、指標、法條、關鍵數字」者優先於長篇散文。

多樣性約束:前 5 名避免都來自同一章節,提高覆蓋面。

檢核清單

Top-3 是否至少一段可直接引用為「答案依據」?

是否出現同詞多義誤命中?(Apple 公司 vs. 蘋果水果)

重排規則可被解釋嗎?(為何這段第一、那段第二)

小結
召回拚廣度、重排拚精度;證據導向的排序最實用。


上一篇
Day 16|Chunking 策略:切多細才剛好
下一篇
Day 18|可溯源輸出:引用不是裝飾,是風險控管
系列文
生成式 AI 30 天觀念導讀:不寫程式也看懂的實戰思維19
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言