Unicode 

统一码
統一碼標誌
别名通用字符集 (UCS)
语言全球性
标准統一碼标准
编码格式UTF-8, UTF-16, GB18030
不常用:
UTF-32, BOCU, SCSU
已淘汰:
UTF-7
前用ISO/IEC 8859, 其他

Unicode,全稱為Unicode標準(The Unicode Standard),其官方機構Unicode聯盟所用的中文名称为統一碼[1],又译作萬國碼統一字元碼统一字符编码[2],是信息技术領域的業界標準,其整理、編碼了世界上大部分的文字系統,使得電腦能以通用劃一的字元集來處理和顯示文字,不但減輕在不同編碼系統間切換和轉換的困擾,更提供了一種跨平臺亂碼問題解決方案。Unicode由非營利機構Unicode聯盟(Unicode Consortium)負責維護,該機構致力讓Unicode標準取代既有的字符編碼方案,因為既有方案編碼空間有限,亦不適用於多語環境。

Unicode伴隨著通用字符集ISO/IEC 10646的標準而發展,同時也以書本的形式[3]對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2022年9月公布的15.0.0[4],已經收錄超過14萬個字符(第十萬個字符在2005年獲採納)。Unicode標準不僅僅只是為文字指定代碼。除了涵蓋視覺上的字形、編碼方法、標準的字符編碼资料外,聯盟官方出版品還包含了關於各書寫系統的細節及呈現方式,如規格化的準則、拆分、定序繪製雙向文本顯示、书写方向、字符特性(如大小寫字母)等等。此外還提供參考資料和視覺圖像,以幫助開發者和設計師正確應用標準。

Unicode備受認可,為ISO納入国际标准,成為通用字符集,即 ISO/IEC 10646。Unicode兼容ISO/IEC 10646,能完整对应各个版本标准[5][6]。Unicode廣泛應用於電腦软件的國際化與本地化過程。很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代作業系統,都採用Unicode來編碼。Unicode最普遍的編碼格式是和ASCII兼容的UTF-8,以及和UCS-2兼容的UTF-16

  1. ^ About Unicode Terminology. unicode.org. [2021-03-25]. (原始内容存档于2021-04-21). 
  2. ^ 陈冰. Flash第一步 ActionScript编程篇. 清华大学出版社有限公司. 2006: 373. ISBN 9787302124207. 
  3. ^ The Unicode Standard 第五版. Addison-Wesley Professional. 2007. ISBN 0321480910. 
  4. ^ Unicode. Unicode 15.0. Unicode Consortium. 2022-09-15 [2022-09-15]. (原始内容存档于2023-01-20). 
  5. ^ Technical Introduction. www.unicode.org. [2021-10-03]. (原始内容存档于2022-04-23). 
  6. ^ FAQ - Unicode and ISO 10646. www.unicode.org. [2021-10-03]. (原始内容存档于2021-12-14). 



取材自維基百科 - 中文時事百科