Unicode 

统一码
New Unicode logo.svg
統一碼標誌
别名通用字符集 (UCS)
语言全球性
标准統一碼标准
编码格式UTF-8, UTF-16, GB18030
不常用:
UTF-32, BOCU, SCSU
已淘汰:
UTF-7
前用ISO/IEC 8859, 其他

Unicode聯盟官方中文名称为統一碼[1],是電腦科學領域的業界標準。它整理、編碼了世界上大部分的文字系統,使得電腦可以用更為簡單的方式來呈現和處理文字。

Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式[2]對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2021年9月公布的14.0.0[3],已經收錄超過14萬個字符(第十萬個字符在2005年獲採納)。Unicode除了視覺上的字形、編碼方法、標準的字符編碼资料外,還包含了字符特性(如大小寫字母)、书写方向、拆分标准等特性的资料库。

Unicode的發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。

Unicode備受認可,並廣泛地應用於電腦软件的國際化與本地化過程。有很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代的作業系統,都採用Unicode編碼。Unicode也被ISO作为国际标准采纳于通用字符集,即 ISO/IEC 10646,且Unicode兼容ISO/IEC 10646且完整对应各个版本标准。[4][5]

  1. ^ About Unicode Terminology. unicode.org. [2021-03-25]. 
  2. ^ The Unicode Standard 第五版. Addison-Wesley Professional. ISBN 0321480910. 
  3. ^ 存档副本. [2020-04-13]. (原始内容存档于2020-03-11). 
  4. ^ Technical Introduction. www.unicode.org. [2021-10-03]. 
  5. ^ FAQ - Unicode and ISO 10646. www.unicode.org. [2021-10-03]. 



取材自維基百科 - 中文時事百科