亂碼

出自維基百科,自由嘅百科全書
跳去: 定向搵嘢
網頁呈現亂碼現象
頁面:日文維基百科文章《書体
對應於粵文維基百科文章《字體

亂碼係指電腦系統顯示唔到正確嘅字符,而顯示一啲無意義嘅字符或空白,例如一堆ASCII代碼。呢啲所顯示出來嘅文字就係稱為亂碼。[1]

亂碼係因爲「所使用嘅字符嘅源碼係本地嘅系統上使用咗錯嘅顯示字庫」,或者喺本地嘅系統嘅字庫揾唔到源碼嘅字符所致。唔同國家同地區嘅文字字庫採用咗相同嘅一段源碼,或者源本文件受到破壞,都有可能產生亂碼。

可能產生嘅原因[編輯]

  • 一般係軟件程序解碼錯誤。例如瀏覽器將GBK碼當成係Big5碼顯示,或電子郵件程序將對方傳來嘅郵件錯誤解碼。如果喺發送時編碼錯誤,收件者嘅電郵程序係唔可能解碼嘅,需要寄件者嘅電郵程序重新編碼再寄。
  • 字體檔案(font file)唔對。
  • 來源編碼錯誤,或者文件受到破壞。

可能解決嘅方法[編輯]

  • 轉換編碼。一般可試Big5GBKUTF-8Unicode嘅一種應用方式,包括世界上主要嘅文字)三種,如涉及嘅唔係中文,可以再試JIS日文)、KR韓文)或者其他文字編碼。徹底嘅解決方法係雙方使用同一編碼系統,例如UTF-8,只要用戶有對應嘅字體檔案就可以正確咁顯示文字。實際上要統一編碼系統重要克服各種客觀嘅困難,現時只有靠軟件(例如Microsoft AppLocale)有更高嘅解碼能力。
  • 轉換字體。如果解碼正確而出現錯誤文字,有可能係字體檔案冇相對應嘅字符,可嘗試轉換字體檔案。
  • 如果本來應該顯示出漢字,但係變咗數字,例如最欣賞相中拉(最欣賞相中拉)等Unicode代碼,可以將呢部分抄低,獨立儲存成html檔案,再用瀏覽器打開解碼。或者可以直接用JavaScript作解讀︰
    alert("最欣賞相中拉");
    
  • 其他。有時解碼嘅方法係要視乎軟件同實際環境,同埋努力嘅嘗試嚟解碼,特別係當你唔知原本用邊個編碼系統。
  • 有時輸入漢字嘅時候都會出現亂碼,不過呢種情況好少出現。最大嘅原因係輸入法所用嘅編碼,同經編輯器輸出嘅字體編碼不符所致,可嘗試轉換字體來解決。例如將GBK編碼嘅輸入法裝到只支援Big5嘅系統上,係唔可能正確顯示所輸入嘅字;必需要選擇Big5編碼嘅輸入法,或把輸入法裝到GBK嘅系統裏。
  • 有關外文所引致嘅亂碼,只有轉換支援某外文嘅字體檔案至解決到。

宗教上嘅講法[編輯]

根據舊約聖經嘅記載(創世紀第十一章1到9節),認為文字標準不一致,係上帝變亂語言造成,可參考巴別塔

參考[編輯]

  1. Schäfer, Ingo. "Premodern Chinese Written Language, an Introduction". 

睇埋[編輯]

出面網頁[編輯]