你是否有聽過 中文資訊交換碼(Chinese Character Code for Information Interchange) ?
根據維基百科「中文資訊交換碼」條目介紹:
1985年其國字整理組從中美會轉至文建會,改名為資訊應用國字整理小組),共同整理中文文字,並解決中文資訊處理的技術問題。
臺灣提出共 4,808 字的「中文資訊交換碼」;「中文資訊交換碼」的架構為美方接受,但要求擴大編碼字集。
根據國家發展委員會檔案管理局CCCII頁面的介紹,我們可以知道。
CCCII是一套相當完整的中文字集和編碼,廣為圖書館界所使用。CCCII以三個位元組來代表一個中文字,並以特別的94x94x94之編碼空間 存放(字元可有830,534個編碼空間),使檢索某一中文字的異體字變得容易,如:強、强、彊三字的後兩個位元組是一樣的。
CCCII 最大的特色就是能 針對異體字 做處理,可以透過後面兩個位元組來找到某個中文字的異體字。這也是在早期中文編碼系統中,很少見的做法。
如果各位對國字整理小組有興趣,可以到中研院資訊所謝清俊教授的專業查看相關資料。
CCCII 非官方網站已經結束,目前仍可從 Internet Archive 找到當初的頁面存檔。
個人對於當初的實作比較感興趣。
文煥終端機(whterm,Wen-Huan Terminal)
目前在此網頁還能下載 CCCII 的數位資料
編寫文章呈現的效果。
註: 圖片來源為 文煥終端機 作者執行終端機程式的螢幕截圖。