我正在尝试使用
HTML Agility Pack从中获取描述文本:
<Meta name="description" content="**this is the text i want to extract and store in a string**" />
前一段时间,有人在Stackoverflow上建议我使用HTMLAgilityPack.但是我不知道如何使用它,我发现的文档(包括下载中的文档)都有无效的链接,因此无法查看文档.
有人可以帮我解决吗?
解决方法
用法与XmlDocument非常相似;您可以在XmlDocument上使用MSDN进行广泛的概述;您可能还需要学习xpath语法(
MSDN).
例:
HtmlDocument doc = new HtmlDocument(); doc.Load(path); // or .LoadHtml(html); HtmlNode node = doc.DocumentNode.SelectSingleNode("//Meta[@name='description']"); if (node != null) { string desc = node.GetAttributeValue("content",""); // TODO: write desc somewhere }
GetAttributeValue的第二个参数是在未找到该属性的情况下返回的默认值.