对XML进行解析的三种解析方式:JDom、sax、dom4j
一、三种解析的特点:
jdom(sun公司)解析:会把xml文档看做一个树,并加载到内存,特别适合做增删改查操作,但当xml文件过大时,容易造成内存溢出
sax(apache)解析:SAX解析允许在读取文档的时候,即对文档进行处理,而不必等整个文档装载完毕后才对文档进行操作。但只能对xml进行读取查询,不能进行增删改操作
dom4j即就是为了解决jdom和sax解析的不足,而产生的另外一种解析方式。即不容易造成内存溢出,又可以对xml文件进行增删改查操作。
二、三种解析大致操作步骤:
jdom解析:
a、调用DocumentBuilderFactory.newInstance()方法得到创建的DOM解析器的工厂
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
b、调用工厂对象的newDocumentBuilder方法得到dom解析器对象
DocumentBuilder dBuilder = dbf.newDocumentBuilder();
c、调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的Document对象,之后就可以对xml文档进行操作啦。
Document document = dBuilder.parse("src/class.xml");
d、具体对XML的操作过程,解析过程中主要用到Node、Element、Document三个主要接口。Element与Document两个接口都实现了Node接口
e、解析完成后需要对xml文档进行更新操作:
创建一个TransformerFactory工厂
TransformerFactory tff = TransformerFactory.newInstance();
创建执行从 Source 到 Result 的复制的新 Transformer
Transformer transformer = tff.newTransformer();
将XML Source 转换为 Result。xmlSource:要转换的 XML 输入,outputTarget:转换 xmlSource 的 Result
transformer.transform(new DOMSource(document),new StreamResult("src/class.xml"));
sax解析:
a、创建SAXParserFactory工厂:
SAXParserFactory spf = SAXParserFactory.newInstance();
b、通过SAXParserFactory工厂获取SAXParser解析器:
SAXParser saxParser = spf.newSAXParser();
c、把xml文档解析为sax对象,这里需要借助DefaultHandler类来解析:
saxParser.parse("src/class.xml",new XXXDefaultHandler());// 自己新建的XXXDefaultHandler需要继承MyDefaultHandler(SAX2事件处理程序的默 认基类)
d、XXXDefaultHandler需要实现DefaultHandler类中的五个基本方法,来实现对XML文档的查询操作(不能对XML进行增删改):
五个基本方法是:
startDocument():接收文档开始的通知
startElement(String arg0,String arg1,String arg2,Attributes arg3):接收元素开始的通知(arg0:名称空间 URI,arg1:本地名称,arg2:限定的名 称,arg3:附加到元素的属性)
characters(char[] arg0,int arg1,int arg2): 接收元素中字符数据的通知(ch - 字符。start - 字符数组中的开始位置。length - 从字符数组中 使用的字符数)
endElement(String arg0,String arg2):接收元素结束的通知(uri - 名称空间 URI,如果元素没有任何名称空间 URI,或者没有
正在执行名称空间处理,则为空字符串。localName - 本地名称(不带前缀),如果没有正在执行名称空间处理,则为空字符串。qName - 限
endDocument():接收文档结束的通知
dom4j解析:
a、需要引入第三方的jar包:dom4j.jar
b、利用SAXReader来读取xml文档
SAXReader saxReader = new SAXReader();
Document document = saxReader.read(new File("src/class.xml"));
c、利用dom4j.jar中提供的Document、Element对XML进行增删改查操作
d、因为是第三方jar包,对XML文档进行更新时,中文会出现乱码,故要设置输出样式:
OutputFormat outputFormat = OutputFormat.createPrettyPrint();
outputFormat.setEncoding("UTF-8");
e、更新原XML文件
XMLWriter xmlWriter = new XMLWriter(new FileOutputStream(new File("src/class.xml")),outputFormat);
xmlWriter.write(document);
xmlWriter.close();