iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 20
0
Elastic Stack on Cloud

Elastic 30天自我修行系列 第 20

在 Elastic Cloud 安裝中文分詞外掛

請到套件作者的下載頁面,下載版本對應的 ZIP 檔

https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v7.9.0

https://ithelp.ithome.com.tw/upload/images/20200920/20130033BO1r7yPwmc.png

點選 Extenstions

https://ithelp.ithome.com.tw/upload/images/20200920/20130033pmifQKDosh.png

填入適當的資訊即可,這邊我都是用複製貼上
https://ithelp.ithome.com.tw/upload/images/20200920/20130033WtjL72iMe7.png

然後就安裝完成囉
https://ithelp.ithome.com.tw/upload/images/20200920/20130033D18ndYlxRD.png

今天的操作是參考這一篇
安裝 ElasticSearch + Kibana 實現中文全文搜尋與數據分析

現在我還需要什麼呢? 詞庫。
畢竟如果後續要進行三國演義拆字,一個適當收錄人名的詞庫是需要。不過也許在此例中,讓我們簡化一點,就去網路上把主要的出場重要角色的人名當成詞庫就好。

那要如何確定今天的外掛安裝是正確的?
使用上文作者的示例,只是我蒐尋的詞更加具備普遍詞 "曾經";我們可以看到會出現 相關的字樣,可見此套件有完裝成功。
https://ithelp.ithome.com.tw/upload/images/20200920/201300332U13BzYuA6.png

結論,NLP/Text Mining 不是我的專長,如果有任何錯誤,歡迎各位大大指正,謝謝。


上一篇
上傳三國演義第一回囉
下一篇
下載三國演義120回,等待明天上傳Elastic Cloud
系列文
Elastic 30天自我修行31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言