在 XML 的解析方式中,我们了解了 SAX 解析,通过解析器和解析处理器就可以对数据进行操作,这里,我们把解析出来的数据进行封装。
我们还是使用以前的book.xml文件:
book.xml
<?xml version="1.0" ?> <!DOCTYPE 书架 SYSTEM "book.dtd"> <书架> <书> <书名>&bookName;</书名> <作者>海竹</作者> <售价>30.0</售价> </书> <书> <书名 ISBN码="521">WEB</书名> <作者>西行</作者> <售价>29.9</售价> </书> </书架>book.xml中引用了book.dtd规范:
book.dtd
<!ENTITY bookName "Think in JAVA"> <!ELEMENT 书架 (书+)> <!ELEMENT 书 (书名,作者*,售价*)> <!ELEMENT 书名 (#PCDATA)> <!ELEMENT 作者 (#PCDATA)> <!ELEMENT 售价 (#PCDATA)> <!ATTLIST 书名 ISBN码 CDATA #IMPLIED>
下面具体操作:
SAXDemo.java
package com.haizhu.xml; import java.io.IOException; import java.util.ArrayList; import java.util.List; import javax.xml.parsers.ParserConfigurationException; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.XMLReader; import org.xml.sax.helpers.DefaultHandler; public class DebugSAXDemo { public static void main(String[] args) throws ParserConfigurationException,SAXException,IOException { // 1、创建工厂 SAXParserFactory factory = SAXParserFactory.newInstance(); // 2、得到解析器 SAXParser saxParser = factory.newSAXParser(); // 3、得到读取器 XMLReader reader = saxParser.getXMLReader(); // 4、设置内容处理器,每个处理器有自己的处理方法 //ListHandler handler = new ListHandler(); //TagValueHandler handler = new TagValueHandler(); //NeedTagValueHandler handler = new NeedTagValueHandler(); BeanListHandler handler = new BeanListHandler(); reader.setContentHandler(handler); // 5、读取xml文档 reader.parse("src/com/haizhu/xml/book.xml"); // 取出封装了数据的 List List<Book> list = handler.getList(); for(Book b : list){ System.out.println(b.getName()); } } } // 把每一本书放在一个book对象中,并把book对象放在一个bookList集合中 class BeanListHandler extends DefaultHandler{ private List<Book> list = new ArrayList<Book>(); private String currentTag; private Book book; public void startElement(String uri,String localName,String qName,Attributes attributes) throws SAXException { super.startElement(uri,localName,qName,attributes); // 这个什么作用?这是使用eclipse自动覆写父类的方法的时候自动填充的语句 currentTag = qName; // 如果读取到开始标签,就把这个标签赋值给 currentTag if(currentTag.equals("书")){ book = new Book(); } } public void characters(char[] ch,int start,int length) throws SAXException { super.characters(ch,start,length); if(currentTag.equals("书名")){ String name = new String(ch,length); book.setName(name); } if(currentTag.equals("作者")){ String author = new String(ch,length); book.setAuthor(author); } if(currentTag.equals("售价")){ String price = new String(ch,length); book.setPrice(Double.parseDouble(price)); } } public void endElement(String uri,String qName) throws SAXException { super.endElement(uri,qName); currentTag = qName; // 如果读取到结束标签,就把这个标签赋值给 currentTag if(currentTag.equals("书")){ list.add(book); } } public List<Book> getList() { return list; } } /** * 解析过程: * 解析的时候是按照标签的顺序进行解析的,先解析到<书架>,发现后面是<书>,在后面是<书名>,在后面才是书名的值:“Think in JAVA”,在后面就是</书> * 这样的话,当检测到<书架>,调用start方法,当检测到<书>、<书名>,还是调用start方法, * 直到检测到"Think in JAVA",调用characters方法,取出这个字符串,我们可以通过new String(ch,length)得到 * 再之后,检测到</书>结束标签,调用end方法 */