為什麼需要談?
第一輪召回像撒網,第二輪重排才是挑魚。沒有重排,Top-1 常常「很像但不對題」。
白話定義
Re-ranking=用更精準的模型或規則,對候選段落做「第二次排序」。
常見情境
跨主題文件、同詞多義(「限制」是法規限制還是硬體限制?)、問句模糊、跨部門術語差異。
常見誤解
「Top-k 夠了」→ 可能全是敘事段,沒有關鍵證據。
「語意最高就第一」→ 真正要找的是能支持結論的證據段。
實用心法
兩段式:大範圍召回(語意+關鍵字+規則)→ 小範圍重排(定義/數字/條號/標題相符加分)。
證據優先:含「定義、指標、法條、關鍵數字」者優先於長篇散文。
多樣性約束:前 5 名避免都來自同一章節,提高覆蓋面。
檢核清單
Top-3 是否至少一段可直接引用為「答案依據」?
是否出現同詞多義誤命中?(Apple 公司 vs. 蘋果水果)
重排規則可被解釋嗎?(為何這段第一、那段第二)
小結
召回拚廣度、重排拚精度;證據導向的排序最實用。