UTF-8和
HTML实体有什么区别?
更多地看UTF-8作为无损和自同步的方法将自然数列表映射到字节流,这样你就可以得到自然数(无损),如果你只是落在流的中间,那就不是一个大问题. (自同步)
每个天然棕色恰好代表一个“角色”.
HTML实体是一种以类似的方式表示这些相同的自然数的方法:,代表自然数127,在作为DEL字符的unicode中.
在UTF-8中,这是字节流:0111 1111
一旦你超过127,它就会超过一个八位字节,因此,128变为:1000 0001 1111 1111.
连续的两个DEL字符变为0111 1111 0111 1111. UTF-8以这样的方式设计,即使例如4字节的字节流,也始终可以从字节流中检索“unicode标量值”的原始列表.可以映射回1到4个不同的此类标量值.因此,UTF-8称之为“可变长度”.