組合字符 

西里爾字母У短音符組合成Ў.

組合字符Combining character)在字體排印學中是用來改變其它字符所用的字符。在拉丁字母中,最常見的組合字符為附加符號(包含重音號)。 [1]

統一碼也包含許多預組字符(Precomposed character),即事先將字符組好並賦予碼位。所以有可能同時使用組合字符和預組字符。這導致了若要比較兩個統一碼字串或設計編碼轉換器時,需要先執行Unicode正規化[2]

在統一碼中,用於歐洲語言和國際音標的組合用附加符號為〈U+0300–U+036F〉。組合用附加符號亦存在統一碼中的多個區塊。在統一碼中,附加符號總是加在主要字符之後。因此,有可能加入多個附加符號。直到2006年,只有少數軟體能正確顯示此類組合。

  1. ^ Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  2. ^ 例如,當在做windows-1258和越南資訊交換標準代碼之間的轉換時,前者使用組合字符而後者使用大量預組字符。轉換器若只是單純地與統一碼做轉換,則會導致混亂。



取材自維基百科 - 中文時事百科