测试之路3——对比XML文件2

距离上一篇对比xml文件隔了很久，并不代表一直做了那么久。

其实上一次对比xml文件一直出错，其实我忽略了一个很简单的问题：我从根目录下得到的所有孩子，是这个根下的，而xml文件的组织形式如下，孩子也有可能是其他的根：

<streams>
    <stream id = "979" presetid = "-1">
        <h264>
            <profile>High</profile>
            <par_y>-1</par_y>
            <fr>source</fr>
            <cqquantizer>0</cqquantizer>
            <deviceid>0</deviceid>
            <qualitylevel>0</qualitylevel>
            <simhd>
                <deblock>0</deblock>
                <deinterlace>2</deinterlace>
                <denoise>0</denoise>
                <delight>0</delight>
                <saturation>0</saturation>
                <hue>0</hue>
            </simhd>
        </h264>
        <aac>
            <profile>LC</profile>
            <channel>1</channel>
            <bitrate>12000</bitrate>

        </aac>
    </stream>
</streams>

这里可以把streams当做所有的根，但是它下面有stream，stream下面还有h264和aac两个节点，h264又有很多节点，而h264本身并没有参数值。

所以我得到的children只是得到stream，我需要遍历孩子，直到它没有某个孩子不再有孩子，再返回。

这么想来，是自己以前学数据结构学的不好，我实际要做的就是遍历树的每一片叶子。于是，我开始遍历整个xml树了。

可是我该怎么遍历，还是像数据结构上说的那样，先根，中根，后根？其实，我并不需要一起去遍历两个xml树，我只要遍历一个xml树（源文件），然后去比对目标文件的xml树就可以了。因为我发现，这我这里目标文件的叶子比源文件的多；且目标文件的叶子在一般情况下都包括目标文件。所以我以源文件为参照物，去寻找目标文件是否存在该节点，如果不存在，则错误；再去比对参数，如果参数不同，则错误。

xml文件中可能存在名字相同，但是实际位置不同的节点，所以对比的节点必须相对位置也相同，所以这也降低了对比难度。所以我可以简单写出对比的测试程序：

	//简单对比方法：
	//传递参数：源文件，返回的目标文件
	//返回值：true表示XML对比一样
	//修改日期：2014.5.26  tanlee
	//对比策略：如果源文件有标签，寻找目标文件是否有对应标签，个数如果不相同
	public boolean simpleCompare(Document sourceDoc,Document targetDoc)  
	{
		Element sourceRoot = sourceDoc.getDocumentElement();
		
		HashSet<String> sourceSet =new HashSet<String>();
		HashSet<String> sourceNames = getNodeNames(sourceRoot,sourceSet);//将所有标签元素提取出来，建立哈希表，方便寻找所有标签

		Iterator<String> sIterator=sourceNames.iterator();//迭代器去遍历

		while(sIterator.hasNext())   //遍历所有源文件的标签
		{
			String sName = sIterator.next();  //遍历迭代器得到相应的标签名字
			NodeList snodeList1 = sourceDoc.getElementsByTagName(sName);//根据名字寻找对应的子节点
			int length1 = snodeList1.getLength();
			NodeList snodeList2 = targetDoc.getElementsByTagName(sName);//根据源文件中的标签寻找对应的
			int length2 = snodeList2.getLength();;
			if(length1 < length2)//当源文件长度小于目标文件，进行判断
			{
//				System.out.println("节点的元素个数不同:" + " " + sName + " " + "源文件个数：" 
//				+ length1 + "    " + "目标文件个数：" + length2 );
				for(int i = 0,j = 0;i < length1;i++) //对nodelist1进行遍历
				{
					String ssValue = new String("cao");
					String tValue = new String("cao");
					ssValue = sourceDoc.getElementsByTagName(sName).item(i).getFirstChild().getNodeValue();
					
					for(j =0;j < length2;j++)//内部循环对比，如果找不到和它相等的值，返回错误
					{
						tValue = targetDoc.getElementsByTagName(sName).item(j).getFirstChild().getNodeValue();
						if(ssValue != null && ssValue != null && ssValue.equals(tValue))//表示找不到
						{
							break;
						}
						else if(ssValue == null && tValue == null)
						{
							break;
						}
					}
					if(j == length2)  //到达循环次数，还是没有找到，说明没有值对应，可以返回错误
					{
						System.out.println("没有找到标签对应的值");
						return false;
					}
				}
			}
			else if(length1 == length2) //长度相同的情况下，进行对比，对比的条件是，如果目标文件能找到且值相同则返回true
			{
				for(int i = 0;i < length1;i++) //对nodelist1进行遍历
				{
					String ssValue = new String(" ");
					String tValue = new String(" ");
					//如果找不到该节点
					if(targetDoc.getElementsByTagName(sName).item(i).getFirstChild() == null )
					{
						if(sourceDoc.getElementsByTagName(sName).item(i).getFirstChild() != null )
						{
							System.out.println("源文件有该标签，而目标文件没有");
							return false; //如果源文件有节点
						}
						else 
							break;
					}
					ssValue = sourceDoc.getElementsByTagName(sName).item(i).getFirstChild().getNodeValue();
					tValue = targetDoc.getElementsByTagName(sName).item(i).getFirstChild().getNodeValue();
					if(ssValue != null&&!ssValue.equals(tValue))//表示找不到
					{
//						System.out.println("Error");
						return false;
					}
					else 
					{
						//System.out.println(ssValue);
					}
				}
			}
			else
			{
				System.out.println("目标文件节点长度小于源文件节点长度");
				return false ; //其他情况就是目标文件的节点长度小于源文件的节点长度，即找不到对应节点，直接返回错误
			}
		}
		return true;
	}

不过，返回的结果都是false，这让我惊呆了，难道是我又写错了？我只能把遍历到的节点输出来，果真节点都不在，这是什么原因？

老大这个时候提醒了我，解析xml的时候需要把xml文件进行格式化，我把源文件和目标文件导出来看一看，一个是3KB，另一个是5KB，很显然就算某些元素信息有差别，文件大小也不会相差如此之大，所以我打开看了一下：源文件没有空格和回车，而目标文件有很多空格和回车，我于是理解他们的格式是不一样的。

需要自己去标准化吗？好像不用了，里面已经写好了方法。是用正则，我不是很懂，至少用了再去学吧，代码如下：

	//标准化传入的XML文件的字符串
	//传递参数：源文件的String，返回的true
	//返回值：修改过的String
	//修改日期：2014.5.29  tanlee
	public String standardXML(String xml)
	{
		xml = xml.replace("\r\n","").replaceAll("(?<=>)\\s+(?=<)","");
		return xml;
	}

这样就基本实现了功能，终于能返回一些true了，通过人工对比发现自己的自动化测试程序虽然简单，但还是能实现功能的。

但是，问题又来了，怎么给自己的源文件添加新的标签，以适应服务器那边增加的参数？看来改进的地方还很多，只能下次再改了。

测试之路3——对比XML文件2

猜你在找的XML相关文章