转载自:利用TinyXML读取VOC2012数据集的XML标注文件裁剪出所有人体目标保存为文件 - Why So SerIoUs? - 博客频道 - CSDN.NET http://blog.csdn.net/masibuaa/article/details/16104717
PASCAL VOC目标检测数据集(The PASCAL Visual Object Classes)
http://pascallin.ecs.soton.ac.uk/challenges/VOC/
图片中的目标用XML文件标注,格式为:
- <annotation@H_403_36@>@H_301_41@
- @H_403_36@folder@H_403_36@>VOC2012@H_403_36@</>@H_301_41@
- filename@H_403_36@>2007_000346.jpg@H_403_36@source@H_403_36@database@H_403_36@>TheVOC2007Database@H_403_36@>PASCALVOC2007@H_403_36@image@H_403_36@>flickr@H_403_36@size@H_403_36@width@H_403_36@>500@H_403_36@height@H_403_36@>375@H_403_36@depth@H_403_36@>3@H_403_36@segmented@H_403_36@>1@H_403_36@object@H_403_36@name@H_403_36@>bottle@H_403_36@pose@H_403_36@>Unspecified@H_403_36@truncated@H_403_36@>0@H_403_36@difficult@H_403_36@bndBox@H_403_36@xmin@H_403_36@>124@H_403_36@ymin@H_403_36@>107@H_403_36@xmax@H_403_36@>230@H_403_36@ymax@H_403_36@>343@H_403_36@>person@H_403_36@>137@H_403_36@>78@H_403_36@>497@H_403_36@>89@H_403_36@>202@H_403_36@>129@H_403_36@>247@H_403_36@>Frontal@H_403_36@>72@H_403_36@>209@H_403_36@>111@H_403_36@>259@H_403_36@>@H_301_41@
对应的图片为:
所以如果想用这个数据集做某种目标识别的训练集的话,需要先从中裁出需要的目标。
下面这个程序就是这个目的,其中用到了TinyXML这个简单易用的XML解析器(XML入门)