解析xml在R中列出:当xml结构不同时,如何一致地访问节点?

前端之家收集整理的这篇文章主要介绍了解析xml在R中列出:当xml结构不同时,如何一致地访问节点?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
背景

我有一个xml设置文件可以看起来像这样:

<level1>
 <level2>
   <level3>
    <level4name>bob</level4name>
   </level3>
 </level2>
</level1>

但是可以有多个level3的实例

<level1>
 <level2>
   <level3>
    <level4name>bob</level4name> 
   </level3>
   <level3>
    <level4name>jack</level4name> 
   </level3>
   <level3>
    <level4name>jill</level4name> 
   </level3>
 </level2>
</level1>

每个级别3也可以有多种类型的4级节点:

<level3>
    <level4name>bob</level4name> 
    <level4dir>/home/bob/ </level4dir> 
    <level4logical>TRUE</level4logical> 
   </level3>

在R中,我使用这个文件加载

settings.xml <- xmlTreeParse(settings.file)
settings <- xmlToList(settings.xml)

我想编写一个脚本,将level4type1中包含的所有值转换为此级别的唯一值的向量,但是我试图以适用于上述所有情况的方式执行此操作.

其中一个问题是类(settings [[‘level2’]])是前两种情况的列表,也是第三种情况的矩阵.

> xmlToList(xmlTreeParse('case1.xml'))
$level2.level3.level4name
[1] "bob"
> xmlToList(xmlTreeParse('case2.xml'))
                  level2
level3.level4name "bob" 
level3.level4name "jack"
level3.level4name "jill"
> xmlToList(xmlTreeParse('case3.xml'))
       level2
level3 List,3
level3 List,1
level3 List,1

问题

我有两个问题:

>如何提取“level4type1”的唯一值的向量
有没有更好的办法呢?

尝试使用XML和 xpath语言的内部节点表示,这是非常强大的.
> xml = xmlTreeParse("case2.xml",useInternalNodes=TRUE)
> xpathApply(xml,"//level4name",xmlValue)
[[1]]
[1] "bob"

[[2]]
[1] "jack"

[[3]]
[1] "jill"

猜你在找的XML相关文章