iT邦幫忙

2025 iThome 鐵人賽

DAY 14
0
IT 管理

全字庫與中文系統常識簡介系列 第 15

為什麼你的檔案會出現亂碼?

  • 分享至 

  • xImage
  •  

為什麼你的檔案會出現亂碼?

純文字檔案出現亂碼

  • 編碼方式不同
    最常見的情況就是「存檔時用的編碼」跟「開檔時讀的編碼」不一樣。
    比方說:存檔時是 Big5,結果用 UTF-8 打開,就會變成亂碼。

  • 跨系統不相容
    Windows、Mac、Linux 早期各自有不同的文字編碼習慣,搬來搬去時常常對不上,打開就亂掉。

  • 字型不支援
    其實文字本身沒問題,但你電腦裡的字型沒有對應字形,結果顯示成方框或亂碼,看起來就怪怪的。像有些人喜歡用 EMOJI 放在文件中,標示各段的關鍵字,如果你的電腦沒裝支援 EMOJI 的字型,就會出現豆腐方框。

  • 檔案被壓縮或傳輸時損壞
    如果檔案內容在傳輸過程中被破壞,某些位元組不完整,解碼時就會出現亂碼或奇怪符號。

  • 混用多種編碼
    有些檔案內容是混雜的,例如前半段是 UTF-8,後半段卻是 Big5,打開時電腦沒辦法判斷正確,顯示就一團亂。

  • BOM 標記問題
    UTF-8 有時會加上「BOM」(檔案開頭的一段特殊符號),如果軟體沒處理好,就會把它當成亂碼顯示。

  • 舊軟體或系統限制
    舊程式可能只認得特定編碼(例如 ASCII 或 Big5),當它遇到比較新的 Unicode 編碼,就會顯示錯亂。

Word 的 DOC、DOCX 文件檔出現亂碼

跟純文字檔案不太一樣,Word 的 DOC、DOCX 是「複雜格式檔案」,裡面不只文字,還包含字型資訊、排版、圖片、表格…所以出現亂碼的原因也比較多。可能的原因有:

  • 版本相容性問題
    舊版的 Word (像 97、2003) 用的是 .doc,新版用 .docx(其實是壓縮過的 XML 格式)。
    如果你用舊版軟體打開新版檔案,沒安裝相容套件時,內容就會顯示亂碼或一堆符號。

  • 缺少正確的字型
    文件雖然存了文字,但沒把字型內嵌進去。
    當你電腦沒有這個字型時,Word 會用其他字型代替 → 特殊字或符號就變成亂碼。

  • 檔案損毀或壓縮異常
    .docx 其實是一個壓縮檔(ZIP 結構)。
    如果傳輸過程中受損、或解壓縮不完整,文件打開時會出現一堆亂碼或 XML 原始碼。

  • 跨系統轉檔問題
    在 Windows 裡編輯的文件,搬去 Mac 或 Linux 上用其他軟體(例如 LibreOffice、WPS),可能解讀不到全部格式 → 部分文字就亂掉。

  • 語言/編碼設定錯誤
    Word 支援多語言,如果文件裡同時有中日韓或特殊符號,但系統的「語言套件」沒裝好,顯示時就會變成問號或亂碼。

  • 誤用純文字編輯器開啟
    .doc / .docx 不是純文字,而是二進位/壓縮 XML 格式。
    如果用記事本、Notepad++ 直接開,就會看到一堆亂碼,因為它並不是用來純文字顯示的。


上一篇
文章進行繁簡轉換要注意的事
系列文
全字庫與中文系統常識簡介15
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言