目標先講清楚:
研究Weaviate和Pinecone分享提高搜尋準度的方式
可以怎麼使用以下技巧處理類似的問題?
「台北親子兩天一夜、溫泉、兒童友善」
「10/10 CI102 班機異動公告」
核心差異
像你要找「價格 ≤ 200、分類是玩具、而且跟『積木』很像」的商品。
特色:兩段分開做。過濾是一件事;相似度又是另一件事,彼此比較「各做各的」。
把大賣場切成很多不重疊的小區(slab),每個小區都內建兩個工具:
查詢來時會這樣跑:
特色:過濾和相似度在同一個抽屜裡「黏在一起」跑,而且是「先標名單,再比相似度」,省很多力氣。
分享向量資料庫,有時效性資料的處理方式
1.Accurate and Efficient Metadata Filtering in Pinecone’s Serverless Vector Database
2.Strategies to improve search results