iT邦幫忙

2

Python是否能針對文案、留言等文字做出標籤分類?

  • 分享至 

  • xImage

版上各前輩大家好!
前陣子做了一些文本情緒分析、字詞排序等的練習~

想請教,Python是否有相關的功能或模組可以做到貼標籤的功能?

類似如下:

商品:舒肥烤雞便當 文案:透過舒肥做法,將雞肉的熟成,做出完美的便當
透過程式產出:舒肥、烤雞、便當、雞肉(類似這樣)

或者一段文字,透過分析文字內容產出標籤或關鍵字(大量執行)

圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中
1
I code so I am
iT邦高手 1 級 ‧ 2022-07-12 09:42:59
最佳解答

使用 jieba 擷取名詞(n),若有缺漏,可以加詞。如果時間/經費充裕,可使用NER自行訓練模型。

您好,感謝回覆,目前用段詞是確定的!另外可能研究如何把斷好的詞包成一包標籤

style840102
把斷詞詞庫存成 txt 檔,在執行python時再載入即可
暗夜裏 3 i
暗夜裡 3 i
阿亞拉 4 nr
阿寅勒 2 nr
艾怡良 10 nr
俺們 311 r
傲慢 315 a
凹面 19 n
哀憫 3 v
哀鳴 46 v
埃米 4 nrt
奧妙 328 nr
奧姆 2 nrt
奧秒 3 nr
奧秘 262 nr
奧美 20 nz
奧馬 10 ns
奧祕 262 nr
安命 2 nz
安曼 51 nr
安民 141 nr
安盟 80 ns
安眠 30 v
安謐 15 nr
愛慕 149 nr
愛民 107 n
中間那個數字是權重,愈大愈重~~
後面ns nr nz ......是詞性,jieba有對照表
檔名 dict.hant.small / large 為自動加載的檔名,你也可以取別的名字,自己用

jieba.load_userdict

載入個人分詞庫

0
japhenchen
iT邦超人 1 級 ‧ 2022-07-11 15:56:56

我是用 python + jieba 做中文分詞,你可以預先把分詞後的權重表加進你的資料庫去做索引,以後查詢就直接連資料庫查某些關鍵字出現在那篇文章裡,而不是讓程式一個一個文字檔去做全文檢索,或,你可以考慮用付費的龍卷風全文檢索系統來達成
https://blog.kennycoder.io/2020/02/12/Python-%E7%9F%A5%E5%90%8DJieba%E4%B8%AD%E6%96%87%E6%96%B7%E8%A9%9E%E5%B7%A5%E5%85%B7%E6%95%99%E5%AD%B8/

您好,感謝回覆,我會再研究看看,謝謝提供方向!

0
lsesroom
iT邦新手 2 級 ‧ 2022-07-11 16:12:24

研究一下資訊抽取(Information Extraction),或是其他自然語言處理的應用。

您好,感謝回覆,我會再研究看看,謝謝提供方向!

我要發表回答

立即登入回答