探索Android软键盘的疑难杂症
深入探讨Android异步精髓Handler
详解Android主流框架不可或缺的基石
站在源码的肩膀上全解Scroller工作机制
Android多分辨率适配框架(1)— 核心基础
Android多分辨率适配框架(2)— 原理剖析
Android多分辨率适配框架(3)— 使用指南
自定义View系列教程00–推翻自己和过往,重学自定义View
自定义View系列教程01–常用工具介绍
自定义View系列教程02–onMeasure源码详尽分析
自定义View系列教程03–onLayout源码详尽分析
自定义View系列教程04–Draw源码分析及其实践
自定义View系列教程05–示例分析
自定义View系列教程06–详解View的Touch事件处理
自定义View系列教程07–详解ViewGroup分发Touch事件
自定义View系列教程08–滑动冲突的产生及其处理
版权声明
- 本文原创作者:谷哥的小弟
- 作者博客地址:http://blog.csdn.net/lfdfhl
本文简介
本文主要介绍XML及其常用的解析方式和JUnit单元测试
XML简介
eXtensible Markup Language简称XML,它是一门可扩展标记语言;之所以称其为可扩展语言,是因为XML的标签都是自定义的。与HTML用于数据展示不同,XML主要用于数据的存储,比如Web开发中的众多配置文件都是由XML实现的。除了作用不一样以外,XML较HMTL而言语法也更加严格。
现在,我们来看一个非常简单的XML文件
<?xml version="1.0" encoding="UTF-8"?>
<students>
<student number="1">
<name>空空苍井</name>
<age>23</age>
<address>东京</address>
</student>
<student number="2">
<name>小泽玛丽</name>
<age>22</age>
<address>大阪</address>
</student>
<student number="3">
<name>杉原杏璃</name>
<age>19</age>
<address>仙台</address>
</student>
</students>
在该示例中定义了根标签<students></students>然后在里面放了三个<student></student>标签用于表示每一个学生的信息;其中每个学生又包括了name,age,address
请注意XML的书写规范:
- 将<?xml version=”1.0” encoding=”UTF-8”?>置于XML文档第一行
- XML文档中必须有且仅有有一个根元素
- XML文档中的元素需要正确闭合
- XML文档中的元素需要正确嵌套
- XML文档中的元素名称区分大小写
- XML文档中的属性值必须用引号引起来
XML的约束
我们可以通过XML的约束来限制XML内容的书写,就像在Java中为集合指定了泛型来约束存入集合中的数据一样;我们可在约束文档定义在XML中允许出现的元素名称、属性及元素出现的顺序等等。XML中常用的约束有DTD和Schema,现在分别介绍。
DTD
DTD(Document Type Definition)文档类型定义,请看如下示例:
<!ELEMENT students (student*) >
<!ELEMENT student (name,age,address)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT address (#PCDATA)>
<!ATTLIST student number ID #required>
在此定义一个.dtd文件,在该文件中约束了xml的元素和属性。
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE students SYSTEM "studentDTD.dtd">
<students>
<student number="number1">
<name>空空苍井</name>
<age>23</age>
<address>东京</address>
</student>
<student number="number2">
<name>小泽玛丽</name>
<age>22</age>
<address>大阪</address>
</student>
<student number="number3">
<name>杉原杏璃</name>
<age>19</age>
<address>仙台</address>
</student>
</students>
我们在该XML文件中使用刚才定义的DTD文件,请参见第2行代码。此时,我们假如写了DTD中未声明的标签就会报错;类似地,其他未遵守DTD文件的写法也会报错。其实,利用DTD文件约束XML的方式还是有些呆板,可读性也不强。所以,请看下面的Schema约束。
Schema
Schema也是一种用于定义和描述XML文档结构与内容的模式语言,其出现是为了优化DTD的局限性。请看如下示例:
<?xml version="1.0"?>
<xsd:schema xmlns="http://www.stay4it.com" xmlns:xsd="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.stay4it.com" elementFormDefault="qualified">
<xsd:element name="students" type="studentsType" />
<xsd:complexType name="studentsType">
<xsd:sequence>
<xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded" />
</xsd:sequence>
</xsd:complexType>
<xsd:complexType name="studentType">
<xsd:sequence>
<xsd:element name="name" type="xsd:string" />
<xsd:element name="age" type="ageType" />
<xsd:element name="gender" type="genderType" />
</xsd:sequence>
<xsd:attribute name="number" type="numberType" use="required" />
</xsd:complexType>
<xsd:simpleType name="genderType">
<xsd:restriction base="xsd:string">
<xsd:enumeration value="male" />
<xsd:enumeration value="female" />
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="ageType">
<xsd:restriction base="xsd:integer">
<xsd:minInclusive value="0" />
<xsd:maxInclusive value="130" />
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="numberType">
<xsd:restriction base="xsd:string">
<xsd:pattern value="stay4it_\d{3}" />
</xsd:restriction>
</xsd:simpleType>
</xsd:schema>
在此定义一个.xsd文件,在该文件中约束了xml的元素和属性。请注意,在该文件中的限制条件非常细致。比如:限制了元素的类型,取值范围,出现次数等。
<?xml version="1.0" encoding="UTF-8"?>
<students xmlns="http://www.stay4it.com" xsi:schemaLocation="http://www.stay4it.com studentSchema.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<student number="stay4it_101">
<name>空空苍井</name>
<age>23</age>
<gender>female</gender>
</student>
<student number="stay4it_102">
<name>小泽玛丽</name>
<age>22</age>
<gender>female</gender>
</student>
<student number="stay4it_103">
<name>杉原杏璃</name>
<age>19</age>
<gender>female</gender>
</student>
</students>
在该XML文档中采用刚才定义的Schema约束XML的书写。同样地,如果所书写的XML代码违反了该Schema约束那么会报错。
XML文档的解析方式
常用的解析XML文档的方式有DOM解析和SAX解析。
DOM解析
将XML文档加载进内存形成一颗DOM树(document对象)并将文档的各个组成部分封装为对象。所以,可以对DOM树进行增删改查。但是DOM树非常占内存,解析速度较慢,故DOM解析不适合较为复杂的XML文件。
如果说Java是面向对象编程,那么DOM是面向节点编程
1 、整个XML文档就是一个文档(Document)节点。
2 、文档中每个元素是也是一个元素(Element)节点
3 、元素中的文字则是文本(Text)节点。
4 、元素的属性是属性(Attr)节点。
5 、标签之间的空格换行也是节点!
6 、总之,XML文档中的每个成分都是一个节点由此可见,XML文档中每一个组成部分都是节点。所以,元素一定是节点,而节点不一定是元素。
SAX解析
相比于DOM,SAX是一种速度更快,更有效的方法。SAX基于事件驱动,它逐行读取文档,一边读取一边解析,所以该方式占内存非常小,速度很快。而且在解析过程的任意时刻均可停止解析,但是该方式只能读取XML不能回写。
在开发中常用DOM4J和XPATH解析XML文件,先对其分别介绍。
利用DOM4J解析XML
请看如下示例:
package cn.xml;
import java.util.List;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.Test;
/** * 本文作者:谷哥的小弟 * 博客地址:http://blog.csdn.net/lfdfhl */
public class TestDOM4J {
@Test
public void testDOM4J01() throws DocumentException{
SAXReader reader = new SAXReader();
Document document = reader.read("src/student.xml");
Element rootElement = document.getRootElement();
List<Element> elementList = rootElement.elements();
int elementSize=elementList.size();
int nodeCount=rootElement.nodeCount();
System.out.println("根节点一共有"+elementSize+"个子元素");
System.out.println("根节点一共有"+nodeCount+"个子节点");
}
@Test
public void testDOM4J02() throws DocumentException{
SAXReader reader = new SAXReader();
Document document = reader.read("src/student.xml");
Element rootElement = document.getRootElement();
analyzeElement(rootElement);
}
private void analyzeElement(Element element) {
int nodeCount=element.nodeCount();
for (int i = 0; i < nodeCount; i++) {
Node node = element.node(i);
if(node instanceof Element){
Element elem=(Element) node;
String elementName=elem.getName();
List<Attribute> attrivuteList=elem.attributes();
int attributeSize=attrivuteList.size();
System.out.println(elementName+"有属性"+attributeSize+"个");
for(int j=0;j<attributeSize;j++){
Attribute attribute=attrivuteList.get(j);
String attributeName=attribute.getName();
String attributeText=attribute.getText();
System.out.println(elementName+"有属性:"+attributeName+",其值为:"+attributeText);
}
analyzeElement(elem);
System.out.println(elementName+"是元素Element");
}else{
String nodeText=node.getText();
System.out.println(nodeText+"文本是节点Node");
}
System.out.println("-------------------");
}
}
}
在该示例中展示了利用DOM4J加载XML,并解析出XML中的元素和节点且获取出元素的名称,节点的文本,属性的值等等内容。在此,务必注意区分元素和节点;请切记:标签之间的空格换行也是一个节点!!!!至于,DOM4J的其他API在此不在依次举出。
当你看完这个例子,如果还不了解元素和节点的区别,请您参照w3school的教程
利用XPATH解析XML
XPATH的全称是Xml Path Language;专门用于查询XML中的数据。怎么查询呢?嗯哼,其实从它的全名可以就能看出点端倪了:该方式和路径是相关联的。
请看如下示例:
package cn.xml;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.Test;
/** * 本文作者:谷哥的小弟 * 博客地址:http://blog.csdn.net/lfdfhl */
public class TestXPATH {
@Test
public void testXPATH1() throws Exception{
SAXReader read = new SAXReader();
Document document = read.read("src/student.xml");
Node node = document.selectSingleNode("/students/student[1]/name");
String text=node.getText();
System.out.println(text);
}
@Test
public void TESTXPATH2() throws Exception{
SAXReader read = new SAXReader();
Document document = read.read("src/student.xml");
List<Node> nodeList = document.selectNodes("//*");
for (int i = 0; i < nodeList.size(); i++) {
Node node = nodeList.get(i);
String name=node.getName();
String text=node.getText();
System.out.println(name+"\t"+text);
}
}
}
现对该示例解析如下:
- 查询单个学生的名字,请参见代码第19行
在student.xml中一共有三个学生,在此获取第一个学生的名字 - 获取student.xml中所有的节点,请参见代码第28行
- 关于XPATH的更多规则请您参见XPathTutorial
JUnit单元测试
为测试方便,可用JUnit进行测试。比如写一个方法,将待测试的代码置于方法体内即可。在使用过程中,请注意:
示例如下:
package cn.com;
import junit.framework.Assert;
import org.junit.Test;
/** * 本文作者:谷哥的小弟 * 博客地址:http://blog.csdn.net/lfdfhl */
public class TestJUnit {
@Test
public void test1(){
int c=1+2;
Assert.assertEquals(3,c);
}
@Test
public void test2(){
int c=1+2;
Assert.assertEquals(4,c);
}
}
最后,贴出项目结构图,如下所示: