java – 为什么org.apache.xerces.parsers.SAXParser不会跳过utf8编码的xml中的BOM?

前端之家收集整理的这篇文章主要介绍了java – 为什么org.apache.xerces.parsers.SAXParser不会跳过utf8编码的xml中的BOM?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有一个带utf8编码的xml.
文件包含BOM作为文件的开头.
所以在解析过程中我遇到了org.xml.sax.SAXParseException:prolog中不允许使用内容.
我无法从文件删除这3个字节.
我无法将文件加载到内存中并在此处删除它们(文件很大).
因此,出于性能原因,我正在使用SAX解析器,如果它们在“”标记之前存在,则只想跳过这3个字节.
我应该为此继承InputStreamReader吗?

我是java的新手 – 请告诉我正确的方法.

解决方法

这已经出现了,当我遇到它时,我在Stack Overflow上发现了 the answer.链接的答案使用PushbackInputStream来测试BOM.

猜你在找的Java相关文章