#From:http://www.cnblogs.com/azol/articles/1137035.html
#W3C定义了三条XML解析器如何正确读取XML文件的编码的规则:
1,如果文挡有BOM(字节顺序标记,一般来说,如果保存为unicode格式,则包含BOM,ANSI则无) ,就定义了文件编码;2,如果没有BOM,就查看XML声明的编码属性;
3,如果上述两个都没有,就假定XML文挡采用UTF-8编码;
#有了这三条规则,那这个规则就清楚多了。
如果没找到BOM,由用XML里的encoding属性指定的编码;
如果xml里encoding没指定的话,就默认用utf-8来解析文档。
然后又可以推出,BOM和ENCODING都有的话,则以BOM指定的为准。
!啊,突然觉得有标准文档多好!虽然是那么的理所当然,至此,终于把xml里的encoding和文件格式的关系弄懂了。
原文链接:https://www.f2er.com/xml/297072.html