在向量空間模型(Vector Space Model)中queries被表示成向量(Vector)形式,在同樣的向量空間中document也被表示成向量(Vec...
TF-IDF演算法資訊檢索中是相當重要的。TF-IDF演算法主要包含了兩個部分:詞頻(term frequency,TF)跟逆向文件頻率(inverse doc...
在介紹布林模型(Boolean Model)之前我們要先定義一個名詞為Index term。每篇文章都由一些index term或是關鍵字(keywords)所...
先來複習一下IR三要素如下: Term Frequency Inverse Document Frequency Document Length Normal...
機率模式 (Probabilistic Model) 機率模式 (Probabilistic Model) 為1976年由Roberston和Sparck Jo...
昨天講到語言模型應用於IR上主要有兩種方法,KL-Divergence Measure以及 Query Likelihood Measure。今天來談談 Que...