在寫python語言的時候,我必須用到"中文斷詞",所以我在網路上
找到了這行程式碼
https://ithelp.ithome.com.tw/articles/10192043?sc=rss.qu
import jieba
jieba.set_dictionary('dict.txt.big')
然後現在的問題就在於必須先把dict.txt.big這個檔案給下載下來
所以我去找別人的github發現了dict.txt.big這個檔案
https://github.com/GoatWang/ithome_ironman/tree/master/day16_NLP_Chinese
但是我不知道要如何下載檔案,還有該把這檔案儲存到哪?
請問該如何解決呢? 希望有人能幫助我解答問題~~
jieba直接pip install jieba就能裝了,裡面就有。
只是預設dict.txt.big這些字典檔是簡體中文的,要先去找到安裝路徑,然後把他轉成繁中,斷詞才會有正確率。
import jieba
print(jieba.__file__)
可以找到jieba的安裝路徑。