亂碼 

用Windows-1252编码编译UTF-8编码的“乱码”(ja:文字化け日文維基百科條目

乱码指的是電腦系統不能顯示正確的字符而顯示其他無意義的字符或空白,通常是使用非预期的字符编码对文本进行解码的结果[1]。这样所顯示出來的文字統稱為亂碼。此外,将非文本的数据以文本方式解码得到的无意义字符也称为乱码。

由于缺少字体或字体中缺少字形而导致字形渲染失败是一个不同的问题,文字通常显示为虚缺号(□)或者十六进制编码,不应与乱码混淆。

例如,微软编译器产生“烫烫烫”“屯屯屯”乱码,编码字符集转换产生的“锟斤拷”“毺絞銝”“脣銝餌”乱码[2]。对于重复的字节串0xCC,根据采用编码的不同,简体GBK会显示“烫烫烫”,台湾BIG-5会显示“昍昍昍”,日本Shift-JIS会显示“フフフフフフ”。

  1. ^ King, Ritchie. Will unicode soon be the universal code? [The Data]. IEEE Spectrum. 2012, 49 (7): 60. doi:10.1109/MSPEC.2012.6221090. 
  2. ^ "烫烫烫屯屯屯" 那些事. 知乎专栏. [2022-10-15]. (原始内容存档于2020-10-20) (中文). 



取材自維基百科 - 中文時事百科