iT邦幫忙

1

如何下載別人github的檔案

在寫python語言的時候,我必須用到"中文斷詞",所以我在網路上
找到了這行程式碼
https://ithelp.ithome.com.tw/articles/10192043?sc=rss.qu
import jieba
jieba.set_dictionary('dict.txt.big')

然後現在的問題就在於必須先把dict.txt.big這個檔案給下載下來
所以我去找別人的github發現了dict.txt.big這個檔案
https://github.com/GoatWang/ithome_ironman/tree/master/day16_NLP_Chinese

但是我不知道要如何下載檔案,還有該把這檔案儲存到哪?

請問該如何解決呢? 希望有人能幫助我解答問題~~

ayu iT邦好手 2 級 ‧ 2019-04-04 20:03:42 檢舉
就dict.txt.big 這個檔嗎? 連結按下去, 就會有Download選項可用了啊, 要儲存到哪自己決定.
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

0
froce
iT邦大師 1 級 ‧ 2019-04-06 12:48:21

jieba直接pip install jieba就能裝了,裡面就有。
只是預設dict.txt.big這些字典檔是簡體中文的,要先去找到安裝路徑,然後把他轉成繁中,斷詞才會有正確率。

import jieba
print(jieba.__file__)

可以找到jieba的安裝路徑。

我要發表回答

立即登入回答