今天選個大資料集,來試試看BM25的語義搜尋。(據說BM25不必先做”斷詞處理”,說錯了,是不必處理stopwords)59萬筆COVID-19相關文獻860M...
今晚來點輕鬆的。資料視覺化,複習一下DataFrame、seaborn引用資料來源:country_vaccination.csv Kaggle Datase...
延續上一篇( 連結 ) 做法,我們換一個資料庫,試試看NLP BM25 的搜尋功能如何。資料庫來源:COVID-19 metadata.csv downloa...