前端之家收集整理的这篇文章主要介绍了
XML编码规则整理,值得收藏,
前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
W3C定义了三条XML解析器如何正确读取XML
文件的编码的规则: 1,如果文挡有BOM(字节顺序
标记,一般来说,如果保存为unicode格式,则包含BOM,ANSI则无),就定义了
文件编码 2,如果没有BOM,就查看XML声明的编码
属性 3,如果上述两个都没有,就假定XML文挡采用UTF-8编码 有了这三条规则,那这个规则就清楚多了。 首先,XML解析器根据
文件的BOM来解析
文件;如果没找到BOM,由用XML里的encoding
属性指定的编码;如果xml里encoding没指定的话,就默认用utf-8来解析文档。然后又可以推出,BOM和ENCODING都有的话,则以BOM指定的为准。 为了避免发生
错误,可以在XML文档声明中
加上一个encoding
属性,指明此XML文档的编码类型,但是不要使用Unicode编码。 在ANSI下,下面的编码类型不会导致
错误,并且汉字
显示正常: <?xml version="1.0" encoding="gb2312"?> <?xml version="1.0" encoding="gbk"?> 下面的编码类型不会导致
错误,并且汉字
显示不正常(乱码): <?xml version="1.0" encoding="windows-1252"?> <?xml version="1.0" encoding="ISO-8859-1"?> <?xml version="1.0" encoding="UTF-8"?> <?xml version="1.0" encoding="UTF-16"?>