我在一个文件夹中有200个xml文件.我想解析文件夹中的所有xml文件,并将其转换为单个数据帧以进行文本挖掘.
library(XML) d1 <- "C:\\Users\\Administrator\\Documents\\file.xml" doc1 <- xmlParse(d1) Data <- xmlToDataFrame(nodes=getNodeSet(doc1,"//Column1"))[c("Column2","Column3","Column4","Column5","Column6")]
谢谢
根据hrbrmstr的建议,下面的代码可以正常工作
setwd("E:/xxx/SplitFIles/") files <- list.files() parse_xml <-function(FileName) { doc1 <- xmlParse(FileName) doc <- xmlToDataFrame(nodes=getNodeSet(doc1,"Column4","Column6")] } Data <- ldply(files,parse_xml)