iT邦幫忙

DAY 27
1

實戰 Java SE 7 系列 第 27

Unicode 6.0 簡介

介紹完了 Project Coin,接著我們來看看 Java SE 7 裡其它的新功能。首先我們要看的新功能是 Unicode 6.0 的支援!
Unicode 是一種文字編碼的方式,什麼是文字編碼?簡單的說就是把我們用的文字,例如中文、日文、英文等…轉換成電腦看得種的符號,基本上電腦只認得 0 和 1,早期美國發明電腦時,電腦只認得英文字母和一些基本的符號,後來隨著作業系統的發展,漸漸地也能顯示各種不同語言的文字,但電腦還是只認得 0 和 1 啊!所以我們要將一個個的文字對應到 0 和 1 的表示方式,而這種對應我們就稱之為文字編碼,為了人類容易閱讀,我們將 0 和 1 的數值用 16 進位的方式來表示。

不同的語言,不同人整理文字順序的方式,也就產生了各式各樣不同的編碼方式,像英文常用的是 ISO 8859-1,繁體中文常用的是 Big5,簡體中文常用的是 GB2312等…。可是不同的文字編碼所造成的困擾是,當我們在交換文書檔案時,如果用錯了編碼方式,那麼那份文件輕則內容變成亂碼,重則可能會損毀檔案無法開敵。所以一定要有一種統一的編碼方式讓大家可以遵循,以降低不同語言的系統在交換檔案時的困擾。因此就誕生了 Unicode!

Unicode 從1987年發想,到1991年10月,Unicode 1.0 版公佈,到1993 年6月的 1.1 版開始支援中文字。一直到去年(2010)10月的 6.0 版,已經支援世界上大部份語言的文字,共109,449個字。Unicode 的特點就是,不管什麼語言的文字和符號,都有一個唯一的編號,所以不會重覆。只要是原生支援 Uicode 的系統,像是Mac OS X、iPhone,就能直接顯示各式個樣不同的文字,不需另外安裝 patch。

Unicode 6.0 除了加入了一些印度、中東的方言外,還加入了撲克牌(playing card)、交通(transport)、地圖(map)符號,而最精彩的是加入了表情符號(emoticon)和繪文字(emoji)

表情符號就是我們平常在 MSN 裡使用的那些基本的表情:
http://www.unicode.org/charts/PDF/U1F600.pdf

繪文字是日本電信商們專有的圖示符號,可以表現的表情圖示比表情符號還多,日系的手機都有支援,其它的手機,可以透過特定的方法,來開啟它的輸入法,例如iPhone。
http://www.unicode.org/charts/PDF/U1F300.pdf

真的很難想像幾年後的 Unicode 7.0 要加入什麼文字!火星文?克林貢文? 呵呵….


上一篇
Project Coin - Simplified varargs method invocation
下一篇
Java 與 Unicode
系列文
實戰 Java SE 7 31

尚未有邦友留言

立即登入留言