亂碼
閱讀設定
提示:呢篇文講嘅唔係亂馬。
亂碼係指電腦系統顯示唔到正確嘅字符,而顯示一啲無意義嘅字符或空白,例如一堆代碼;呢啲所顯示出來嘅文字就係稱為亂碼。
亂碼本來係指電腦檔案或者程式用嘅內碼唔係用家用緊嘅內碼,所以顯示出錯,後來引伸指所有睇落
由用錯內導致嘅亂碼喺2020年代基本上已經唔係問題,因為大部分系統已經轉咗用統一碼;喺網上仍然遇到嘅亂碼問題好多時係多次編碼錯誤,屬於無法修復嘅情況。
可能產生嘅原因
[編輯]用錯內碼
[編輯]- 來源編碼錯誤。
- 軟件解碼錯誤。
例如瀏覽器將GBK碼當成係Big5碼顯示,或電子郵件程序將對方傳來嘅郵件錯誤解碼。如果喺發送時編碼錯誤。如果解碼錯誤之後再編碼錯誤,結果可能會無法修復[1],需要寄件者嘅電郵程序重新編碼再寄等等。
其他原因
[編輯]- 字體檔案缺字。
- 文件受到破壞。
可能解決嘅方法
[編輯]- 轉換編碼。如果係漢字內容一般可以試Big5、GBK、UTF-8(統一碼嘅一種形式)、EUC-JP、Shift-JIS(日文)、EUC-KR(韓文)。喺2020年代基本上已經唔係問題,有啲瀏覽器亦唔再有轉換編碼嘅功能。
- 轉字體。如果解碼正確而出現錯誤文字,可能係有可能係字款缺字,即係字體檔案冇相對應嘅字符,可嘗試換字體。呢種情況喺用 Word 處理英文比㝔常見。
- 如果啲字變咗數字,例如最欣賞相中拉(最欣賞相中拉)等Unicode代碼,可以將呢部分抄低,獨立儲存成html檔案,再用瀏覽器打開解碼。或者可以直接用JavaScript作解讀︰
alert("最欣賞相中拉");
- 有時輸入漢字嘅時候都會出現亂碼,不過呢種情況好少出現。最大嘅原因係輸入法所用嘅編碼,同經編輯器輸出嘅字體編碼不符所致。解決方法係將輸入法設定成編輯器預期嘅編碼,或者將編輯器設定成用輸入法用嘅編碼。
有時解碼嘅方法係要視乎軟件同實際環境,同埋努力嘅嘗試嚟解碼,特別係當你唔知原本用邊個編碼系統。
參考
[編輯]- ↑ Lunde, Ken. "Encoding Methods". CJKV Information Processing (第2版). O’Reilly. p. 294.
睇埋
[編輯]出面網頁
[編輯]- 郵件亂碼
- E-mail乱码解码器(简体中文)
- E-mail亂碼解碼器(繁體中文)
- E-mail乱码解码器