SAXREADER读取xml文件，报字节 UTF-8 序列的无效字节 1。 Nested exception: 1 字节 UTF-8 序列的无效字节 1。

使用saxReader 读取xml文件的时候，报字节 UTF-8 序列的无效字节 1。 Nested exception: 1 字节 UTF-8 序列的无效字节 1。

去掉xml文件的中文注释时，没有报错。发现文本存放的编码为ANSI所致。将文本另存为utf-8格式，再重新读xml文件，没有出现问题了。

出现该问题的时候，百度，先前有人遇到同样的问题，解决办法：xml中1字节的UTF-8序列的字节1无效

今天在eclipse中编写pom.xml文件时，注释中的中文被eclipse识别到错误：Invalid byte 1 of 1-byte UTF-8 sequence，曾多次遇到该问题，问题的根源是：

The cause of this is a file that is notUTF-8is being parsed as UTF-8. It is likely that the parser is encountering a byte value in the rangeFE-FF. These values are invalid in the UTF-8 encoding.

但这次很诡异，我使用notepad++将pom.xml的编码保存为“UTF-8无BOM”形式，pom.xml文件内的encoding属性设置为“UTF-8”，问题依旧啊，郁闷了，难道上述的理论有问题？还是eclipse的bug呢？在网上看了半天，基本都是这么说的。

第一，可以直接在XML文件中更改UTF-8为GBK或GB2312

<?xml version="1.0" encoding="GB2312"?>

第二，可以在Eclipse中更改，在 eclipse 的功能表 [Project]→[Properties]，點選 [Resources]，在右邊的「Text file encoding」，把原來是系統預設的編碼，改為「UTF-8」。

第一种方案可行，属于逃避的方法，放弃！第二种也不是解决我这种问题的，继续网上搜索惊奇的发现，原来解决方案是这样的：

把xml的encoding属性值UTF-8改为UTF8

SAXREADER读取xml文件，报字节 UTF-8 序列的无效字节 1。 Nested exception: 1 字节 UTF-8 序列的无效字节 1。

猜你在找的XML相关文章