背景
我有一个xml设置文件可以看起来像这样:
<level1> <level2> <level3> <level4name>bob</level4name> </level3> </level2> </level1>
但是可以有多个level3的实例
<level1> <level2> <level3> <level4name>bob</level4name> </level3> <level3> <level4name>jack</level4name> </level3> <level3> <level4name>jill</level4name> </level3> </level2> </level1>
每个级别3也可以有多种类型的4级节点:
<level3> <level4name>bob</level4name> <level4dir>/home/bob/ </level4dir> <level4logical>TRUE</level4logical> </level3>
在R中,我使用这个文件加载
settings.xml <- xmlTreeParse(settings.file) settings <- xmlToList(settings.xml)
我想编写一个脚本,将level4type1中包含的所有值转换为此级别的唯一值的向量,但是我试图以适用于上述所有情况的方式执行此操作.
其中一个问题是类(settings [[‘level2’]])是前两种情况的列表,也是第三种情况的矩阵.
> xmlToList(xmlTreeParse('case1.xml')) $level2.level3.level4name [1] "bob" > xmlToList(xmlTreeParse('case2.xml')) level2 level3.level4name "bob" level3.level4name "jack" level3.level4name "jill" > xmlToList(xmlTreeParse('case3.xml')) level2 level3 List,3 level3 List,1 level3 List,1
问题
我有两个问题:
>如何提取“level4type1”的唯一值的向量
有没有更好的办法呢?
尝试使用XML和
xpath语言的内部节点表示,这是非常强大的.
> xml = xmlTreeParse("case2.xml",useInternalNodes=TRUE) > xpathApply(xml,"//level4name",xmlValue) [[1]] [1] "bob" [[2]] [1] "jack" [[3]] [1] "jill"