我有一个几千兆字节的XML. XML中没有空格.
所以我写了一个小C#代码分成单个文件(它有一些额外的代码来执行一些东西,例如在测试时随机化)
using (XmlReader MyReader = XmlReader.Create(@"d:\xml\test.xml")) { while (MyReader.Read()) { switch (MyReader.NodeType) { case XmlNodeType.Element: if (MyReader.Name == "Customer") { XElement el = XElement.ReadFrom(MyReader) as XElement; if (el != null) { custNumber = (string)el.Element("CustNumber"); output = @"d:\xml\output\" + custNumber; File.WriteAllText(output,el.ToString()); } } break; } } }
然后我用PowerShell解析生成的文件,主要是因为我发现在服务器上使用它更容易,而规格可以改变,我可以动态更改脚本.
那么……将上面的内容转换为PowerShell的最简单的方法是什么,将[.Net这里]置于一切之前?如果它在一行上有“< cust”并且“omer>”,我将不得不读取字节的字节在下一个?
这应该与你想要在Powershell中做的非常接近:
$f = [System.Xml.XmlReader]::create("d:\xml\test.xml") while ($f.read()) { switch ($f.NodeType) { ([System.Xml.XmlNodeType]::Element) # Make sure to put this between brackets { if ($f.Name -eq "Customer") { $e = [System.Xml.Linq.XElement]::ReadFrom($f) if ($e -ne $null) { $custNumber = [string] $e.Element("CustNumber") $e.ToString() | Out-File -Append -FilePath ("d:\xml\output\"+$e.ToString()) } } break } } }