当前位置: 代码迷 >> 综合 >> 代码点(code point)和代码单元(code units)
  详细解决方案

代码点(code point)和代码单元(code units)

热度:14   发布时间:2024-01-13 04:57:57.0

1. 解释一

charJava中,char类型为16个二进制位,原本用于表示一个字符。但后来发现,16位已经不够表示所有的字符,所以后来发展出了代码点表示字符的方法。

代码点(code point):是指编码字符集中,字符所对应的数字。有效范围从U+0000U+10FFFF。其中U+0000U+FFFF为基本字符,U+10000U+10FFFF为增补字符。

代码单元(code unit):对代码点进行编码得到的12个16位序列。其中基本字符的代码点直接用一个相同值的代码单元表示,增补字符的代码点用两个代码单元的进行编码,这个范围内没有数字用于表示字符,因此程序可以识别出当前字符是单单元的基本字符,还是双单元的增补字符。

以上摘自漂洋过海来看你的博客。

2. 解释二

《Java核心技术 卷1》中这样描述:

  相关解决方案