在過去的方法中 WSD 都是用頻率最高的詞義,但這會隨著語料的不同而不準。因為缺少訓練資料,使用監督式學習也相當不易。然非監督的做法之所以做不好,其根本原因在於沒有使用上下文資訊。本文採用一個自動收集的字典,以及 WordNet 的相似度工具定位出最有可能的詞義。在 SenEval-2 的實驗上,獲得了 64% 的 precision。
Finding Predominant Word Senses in Untagged Text
Diana McCarthy & Rob Koeling & Julie Weeds & John Carroll
ACL 2004
https://www.aclweb.org/anthology/P04-1036/