Day 17｜Re-ranking 與組合檢索：先找得到，再找得準

2025 iThome 鐵人賽

DAY 17

生成式 AI

17th鐵人賽

161 瀏覽

為什麼需要談？
第一輪召回像撒網，第二輪重排才是挑魚。沒有重排，Top-1 常常「很像但不對題」。

白話定義
Re-ranking＝用更精準的模型或規則，對候選段落做「第二次排序」。

常見情境
跨主題文件、同詞多義（「限制」是法規限制還是硬體限制？）、問句模糊、跨部門術語差異。

常見誤解

「Top-k 夠了」→ 可能全是敘事段，沒有關鍵證據。

「語意最高就第一」→ 真正要找的是能支持結論的證據段。

實用心法

兩段式：大範圍召回（語意＋關鍵字＋規則）→ 小範圍重排（定義/數字/條號/標題相符加分）。

證據優先：含「定義、指標、法條、關鍵數字」者優先於長篇散文。

多樣性約束：前 5 名避免都來自同一章節，提高覆蓋面。

檢核清單

Top-3 是否至少一段可直接引用為「答案依據」？

是否出現同詞多義誤命中？（Apple 公司 vs. 蘋果水果）

重排規則可被解釋嗎？（為何這段第一、那段第二）

小結
召回拚廣度、重排拚精度；證據導向的排序最實用。

系列文

0 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

立即登入留言

IT邦幫忙