編碼方式不同
最常見的情況就是「存檔時用的編碼」跟「開檔時讀的編碼」不一樣。
比方說:存檔時是 Big5,結果用 UTF-8 打開,就會變成亂碼。
跨系統不相容
Windows、Mac、Linux 早期各自有不同的文字編碼習慣,搬來搬去時常常對不上,打開就亂掉。
字型不支援
其實文字本身沒問題,但你電腦裡的字型沒有對應字形,結果顯示成方框或亂碼,看起來就怪怪的。像有些人喜歡用 EMOJI 放在文件中,標示各段的關鍵字,如果你的電腦沒裝支援 EMOJI 的字型,就會出現豆腐方框。
檔案被壓縮或傳輸時損壞
如果檔案內容在傳輸過程中被破壞,某些位元組不完整,解碼時就會出現亂碼或奇怪符號。
混用多種編碼
有些檔案內容是混雜的,例如前半段是 UTF-8,後半段卻是 Big5,打開時電腦沒辦法判斷正確,顯示就一團亂。
BOM 標記問題
UTF-8 有時會加上「BOM」(檔案開頭的一段特殊符號),如果軟體沒處理好,就會把它當成亂碼顯示。
舊軟體或系統限制
舊程式可能只認得特定編碼(例如 ASCII 或 Big5),當它遇到比較新的 Unicode 編碼,就會顯示錯亂。
跟純文字檔案不太一樣,Word 的 DOC、DOCX 是「複雜格式檔案」,裡面不只文字,還包含字型資訊、排版、圖片、表格…所以出現亂碼的原因也比較多。可能的原因有:
版本相容性問題
舊版的 Word (像 97、2003) 用的是 .doc,新版用 .docx(其實是壓縮過的 XML 格式)。
如果你用舊版軟體打開新版檔案,沒安裝相容套件時,內容就會顯示亂碼或一堆符號。
缺少正確的字型
文件雖然存了文字,但沒把字型內嵌進去。
當你電腦沒有這個字型時,Word 會用其他字型代替 → 特殊字或符號就變成亂碼。
檔案損毀或壓縮異常
.docx 其實是一個壓縮檔(ZIP 結構)。
如果傳輸過程中受損、或解壓縮不完整,文件打開時會出現一堆亂碼或 XML 原始碼。
跨系統轉檔問題
在 Windows 裡編輯的文件,搬去 Mac 或 Linux 上用其他軟體(例如 LibreOffice、WPS),可能解讀不到全部格式 → 部分文字就亂掉。
語言/編碼設定錯誤
Word 支援多語言,如果文件裡同時有中日韓或特殊符號,但系統的「語言套件」沒裝好,顯示時就會變成問號或亂碼。
誤用純文字編輯器開啟
.doc / .docx 不是純文字,而是二進位/壓縮 XML 格式。
如果用記事本、Notepad++ 直接開,就會看到一堆亂碼,因為它並不是用來純文字顯示的。