如果我有一个字符串,其中包含我刚刚从HTTP Post返回的页面中的html,那么如何将其转换为可让我轻松遍历DOM的内容?
我认为HtmlDocument对象有意义,但它没有构造函数.是否有任何类型可以轻松管理HTML DOM?
谢谢,
马特
解决方法
HtmlDocument是已由WebBrowser控件加载的文档的实例.因此没有ctor.
到目前为止,Html Agility Pack是我用过的最好的图书馆
codeplex wiki的一个例子
HtmlDocument doc = new HtmlDocument(); doc.Load("file.htm"); foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href]")) { HtmlAttribute att = link["href"]; att.Value = FixLink(att); } doc.Save("file.htm");