1、SAX处理机制
SAX是一种基于事件驱动的API。利用SAX解析XML文档,牵涉到两个部分:解析器和事件处理器。解析器负责读取XML文档,并向事件处理器发生事件,如元素开始和元素结束事件;而事件处理器则负责对事件做出响应,对传递的XML数据进行处理。
2、原理
SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。
3、实例(解析xml文件):
实践中用到sax方式解析xml文件,做一个简单记录。
A、获取文件大小,通过判断0xefbbbf,是UTF8编码类型,把文件读取的一个全局buffer中存储,并把'\r\n---\n,\r---\n'
B、把buffer作为入参,逐个字符的去判断,获取到字符元素对应的解析器,如:"<?xml"为xml头,"<!--"为注释,element:<...>.
C、调用其对应的解析器分别进行解析xml头、注释、声明、元素等
D、对于元素(<...>val<...>)的处理,对元素中的字段名、字段属性、字段值、结束符(/)等产生相应的事件并调用事件处理器,在事件处理器中分别对各个事件进行处理。