我想使用我熟悉的语言 –
Java,C#,Ruby,PHP,C/C++,尽管任何语言或伪代码的示例都非常受欢迎.
将大型XML文档拆分为仍然有效的XML的较小部分的最佳方法是什么?为了我的目的,我需要将它们分成大约三分之二或四分之一,但为了提供示例,将它们分成n个组件会很好.
当然,您总是可以提取顶级元素(这是否是您想要的粒度取决于您).在C#中,您将使用XmlDocument类.例如,如果您的XML文件看起来像这样:
<Document> <Piece> Some text </Piece> <Piece> Some other text </Piece> </Document>
XmlDocument doc = new XmlDocument(); doc.Load("<path to xml file>"); XmlNodeList nl = doc.GetElementsByTagName("Piece"); foreach (XmlNode n in nl) { // Do something with each Piece node }
获得节点后,您可以在代码中对它们执行某些操作,或者可以将节点的整个文本传输到其自己的XML文档,并对其进行操作,就好像它是一个独立的XML片段(包括保存它)回到磁盘等).