iT邦幫忙

0

網路上,不知有沒有能夠「自動組詞」的程式

ebag 2016-11-04 09:39:042728 瀏覽
  • 分享至 

  • xImage

想請問,如果我們有一些沒有重複的字頭(幾千字),不知道有沒有一個能夠「自動組詞」的程式?可以讓這些字頭轉換更具應用價值的「詞彙」呢?

看更多先前的討論...收起先前的討論...
fillano iT邦超人 1 級 ‧ 2016-11-04 10:55:25 檢舉
自己寫的話,一些參考資料:https://g0v.hackpad.com/3du.tw-ZNwaun62BP4
ebag iT邦新手 5 級 ‧ 2016-11-04 11:41:39 檢舉
去年開始都會定時參加「萌典松」的聚會。最近一次的聚會在11月12日,不知相關的高手是否會在。
我知道樓主要什麼,類似搜尋引擎的 自動輸入吧
例如打 天 可能會出現天下無敵 這樣的方式
而樓主又說他是一堆字,希望經過一個程序處理完
可以自動讓這對字變成一堆詞彙
那簡單說,原始檔可能是這樣




這樣的原始檔
經過程序處理後變成
天下
地上
無雙
雙雙
再跑一次也許會變成
天下無雙
地上人間
無獨有偶
雙雙對對
如果是這樣,程序是不難寫,重點是詞彙資料庫要怎麼建而已
ebag iT邦新手 5 級 ‧ 2016-11-04 15:57:25 檢舉
其實我原本並沒有想說要「自動生成」詞彙。或許因為我不是從程式設計的角度發想,經「窮嘶發發發」一說,這樣來看,字頭得需要有個參考資料庫。如果使用現有的一些像「辭海」、「漢語大詞典」之類的內容不知可行否?

這些字頭本身是有來源,例如甲骨、金文大字典等。如果搭配上原始字形圖檔,然後有自動生成的詞彙,這樣查詢者就可以看到一些整句的古文字。(或許是現代的詞彙,但字形是古代的文字)
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中
0
賽門
iT邦超人 1 級 ‧ 2016-11-04 10:59:00

以讓這些字頭轉換更具應用價值的「詞彙」

大多數人都無法做到的事,要求系統能做到,我想到一個成語:緣木求魚。

賽門 iT邦超人 1 級 ‧ 2016-11-04 11:00:44 檢舉

現在流行機器學習或說深層學習(深度學習),你得先讓機器認識所謂更具應用價值的"詞彙"。

ebag iT邦新手 5 級 ‧ 2016-11-04 11:08:49 檢舉

其實我的原意是說:

我目前有一些字辭典等文字編的字頭,數千字的字頭。如果有一個程式能組成古代或現代使用的有意義的詞語。這樣日後這些字頭就會更有應用的價值。

並不是期待要有個程式,能夠自動辨識「哪些有價值,哪些沒價值」詞彙。

newkevin iT邦高手 1 級 ‧ 2016-11-04 11:22:13 檢舉

搜尋文章產生器 看是否修改使用方式 符合你要用的

0
baida0630
iT邦新手 4 級 ‧ 2016-11-04 11:20:15

看起來你想問的是類似"智慧標籤"這種東西嗎?

ebag iT邦新手 5 級 ‧ 2016-11-04 11:35:04 檢舉

不是喔。

0
newkevin
iT邦高手 1 級 ‧ 2016-11-04 11:36:26

這樣對不對
假設你有 A字頭一堆 +B字尾一堆
你要的結果是 AB
A+B1 A+B2 .........
A1+B1 A1+B2 .........
等於 A 你 我 他 B 愛 恨 情 仇
你愛 你恨 你情 你仇
我愛 我恨 我情 我仇
他愛 他恨 他情 他仇

newkevin iT邦高手 1 級 ‧ 2016-11-04 11:37:41 檢舉

又忘記預覽
應該送出直接預覽
再送出比較方便

ebag iT邦新手 5 級 ‧ 2016-11-04 11:38:56 檢舉

原始是單字的字頭,想自動轉換呈現的。是一些詞彙,並不是只是兩個字頭的組合。

0
海綿寶寶
iT邦大神 1 級 ‧ 2016-11-04 13:15:21

教育部辭典查詢
保證有意義

選我正解
/images/emoticon/emoticon68.gif

0
chommy
iT邦新手 1 級 ‧ 2016-11-05 13:01:17

這題讓我想到n年以前上吳靜吉老師的課時,
玩過的一個遊戲,像這樣:
字頭--> 本來
組成現代意義的詞語--> 廖福本來我家買票。
是這樣嗎?
那這程式不好寫吧!

ebag iT邦新手 5 級 ‧ 2016-11-05 13:55:17 檢舉

並不是要另外生成原來字頭沒有的字,
字頭原來如果有這四字:




就只會組成具有意義詞條,如:

我們
你們
他們

這樣程式的難度應該會低一些?

0
kgame
iT邦新手 4 級 ‧ 2016-11-07 03:56:46

反過來思考,不必把這堆字組成詞彙呀

而是把這些字作為搜尋辭典的關鍵字

搜索出來的詞彙不就是你要的答案嗎

我要發表回答

立即登入回答