一般都是直接拿字型來處理。有那種單純注音的字型。
會比較單純許多。
另外一招就是找編碼字詞檔來處理。這個我就比較不熟。
一般這是給輸入法用的東西。是否可以應用我就不太清楚了。
我比較常用的是找有拼音的字型來做處理。
浩瀚星空大大好:
第一種方法"直接拿字型來處理"
我想了解的詳細一些,能再說一下嗎?
因為我的APP是要用RSS抓日文/台灣 的新聞(已做到)
並將那些日文/中文的漢字翻成假名或是羅馬拼音/注音(未做到)
那我要怎麼get到這個字就知道他的拼音/注音呢?
謝謝
【怎麼 get 到這個字就知道他的拼音/注音呢?】
好不容易有一項我會的,我來野人獻曝一下,我寫的程式剛好有提供這個功能。
理念上很簡單,技術上更不困難,把所有的中文字建成一個資料庫,有二個欄位,一欄是該字,另一欄是該字的注音,寫一個 mysql 函數,傳入該字,回傳該字的注音。
唯一困難的是,有時一個字有好多個音,比如『姍』這個字。
『姍姍來遲』一般教的是『ㄕㄢ ㄕㄢ ㄌㄞˊ ㄔˊ』,
可是我的國文老師教的是『ㄒㄧㄢ ㄒㄧㄢ ㄌㄞˊ ㄔˊ』
這個人言言殊,系統沒能幫您判斷,而且 cola 大仔也不准我在此討論文學,您就要自己想辦法啦。
附註:這個資料庫還有另一項妙用,拿來寫詩很管用,尤其要押韻時更棒,比如『中、風、通、紅、共、充....』都是同一個韻尾,一查就好。(希望 cola 大仔沒看到這一段)
ckp6250好:
我了解您的意思,不過這真是好大工程.....
先不說中文字真的很多,建不完
還有日文的漢字更是一字多音....(我無法預料新聞會有那些字..
想問大大有沒有推薦的jar檔....
謝謝
我只能就我會的幫助您,日文我不懂,無能為力。
不過,能不能把原先的兩欄,改成三欄,多一欄日文注音呢?這個我不懂,您想看看。
中文字雖多,也不用自己去建,早就有善心人士替我們做好了,我自己的資料庫,目前就有 27542 個字。
https://sites.google.com/site/ianho7979/InputMethodTables
您去請教 Ian Ho 這位大大,他長期專心研究這方面的,可惜沒什麼人和他討論,我相信他一定樂意有人和他交流,我的字庫也是由他那兒下載轉換的。
另外,我覺得重點在資料庫,不在 jar 檔,自已寫也很容易,看是要傳單字、單句、或整篇文章,應該都沒什麼問題。
簡單來說,就是找本身字型就標注注音的字型直接用。
這算是最懶的招式了。
但如果你要的是拆解的方式。
這的確需要另一個字詞庫來處理,很大。
一般是給輸入法用的。正常有可直接下載
像ckp6250說的方式那樣處理。工程比較大。
如果你只是為了單純國字旁邊出現注音的話。建議你直接找有注音的字型來用就好了。比較單純點。只要做好字型載入的動作就行。
浩大師的說法是對的,萬事以簡便為原則。
我當初會去建這個資料庫,目的是為了讓使用者在建立【客戶基本資料】時有一個方便的工具,因為有些人會用公司名稱的注音碼當做代碼的前幾碼,我這個工具有利於她的操作效率。
27542 個字的資料庫,差不多夠用了,其中有一半以上的字,我認不出來。
目的不同,工具就會不同,不拘一格。