iT邦幫忙

資訊檢索與擷取相關文章
共有 6 則文章
鐵人賽 自我挑戰組 DAY 5

技術 Day05:向量空間模型(Vector Space Model)

在向量空間模型(Vector Space Model)中queries被表示成向量(Vector)形式,在同樣的向量空間中document也被表示成向量(Vec...

鐵人賽 自我挑戰組 DAY 4

技術 Day04:TF-IDF演算法

TF-IDF演算法資訊檢索中是相當重要的。TF-IDF演算法主要包含了兩個部分:詞頻(term frequency,TF)跟逆向文件頻率(inverse doc...

鐵人賽 自我挑戰組 DAY 2

技術 Day02:布林模型(Boolean Model)

在介紹布林模型(Boolean Model)之前我們要先定義一個名詞為Index term。每篇文章都由一些index term或是關鍵字(keywords)所...

鐵人賽 自我挑戰組 DAY 6

技術 Day06:最佳匹配模型(Best Match Model)

先來複習一下IR三要素如下: Term Frequency Inverse Document Frequency Document Length Normal...

鐵人賽 自我挑戰組 DAY 3

技術 Day03:機率模型 (Probabilistic Model)

機率模式 (Probabilistic Model) 機率模式 (Probabilistic Model) 為1976年由Roberston和Sparck Jo...

鐵人賽 自我挑戰組 DAY 6

技術 Day08: Query Likelihood Measure

昨天講到語言模型應用於IR上主要有兩種方法,KL-Divergence Measure以及 Query Likelihood Measure。今天來談談 Que...