iT邦幫忙

2025 iThome 鐵人賽

DAY 1
0
IT 管理

全字庫與中文系統常識簡介系列 第 1

為什麼電腦一開始只能處理英文?

  • 分享至 

  • xImage
  •  

並不是說電腦是美國人發明,所以一開始只能處理英文?其實是跟

  1. 字元數量
  2. 硬體限制
  3. 標準化制定
  4. 輸入與顯示技術不成熟

幾個重要因素有關。

字元集小,方便設計使用

  • 英文字母只有 26 個大寫 + 26 個小寫 + 數字 + 標點符號,加起來不到 128 個符號。
  • 這樣的數量剛好可以用 1 個 Byte(8 位元) 來編碼,甚至更早的電腦,用 7 位元 ASCII 就能夠完全涵蓋。
  • 相比之下,五大碼的中文常用字就有 5401 個,還一堆缺字,根本就超過早期電腦硬體能承受的範圍。

硬體資源有限

  • 早期電腦的記憶體只有幾 KB,甚至不到 1 KB。
  • 要儲存中文字的字型(像素資料)需要很大空間,一個中文字 16×16 點陣就要 32 Bytes,一萬個字就要 300 KB 以上,在 1970 年代這是天文數字。
  • 所以設計電腦時,先支援最「輕量」的英文就好。

為什麼一萬個中文字就要 300 KB 以上?

假設使用 16×16 點陣字(這是早期常見的中文字庫大小)。每個字是一個 16 行 × 16 列 的像素格子。每一格用「 1 個 bit 」表示(0 = 白色背景,1 = 黑色點)。

所以:

16 × 16 = 256 bits

1 Byte = 8 bits
256 bits ÷ 8 = 32 Bytes

👉 也就是說,一個 16×16 的中文字,需要 32 Bytes 才能完整儲存。

中文字常用字超過 13,000 個,早期字庫通常會收錄至少一萬字。

1 字 = 32 Bytes
10,000 字 × 32 Bytes = 320,000 Bytes
1 KB = 1024 Bytes
320,000 Bytes ÷ 1024 ≈ 312.5 KB

ASCII 標準最早制定

  • 美國在 1963 年制定了 ASCII 編碼(American Standard Code for Information Interchange),用 7 位元就能編所有英文、數字與常見符號。
  • ASCII 成為國際通訊與電腦的基礎標準。
  • 電腦技術最初由歐美主導,標準自然以英文為中心。

輸入與顯示技術不成熟

  • 英文輸入只需要 鍵盤 26 個字母鍵,中文輸入卻需要複雜的輸入法(拼音、注音、倉頡、手寫)。
  • 顯示裝置一開始只能顯示簡單的 ASCII 字型(5×7、8×8 點陣),沒有足夠解析度顯示中文字。

下一篇
Apple II 如何成為第一台普及且能顯示中文的家用電腦?
系列文
全字庫與中文系統常識簡介3
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言