我是XPath的新手,但我可以看到它是多么强大.我正在看这个
link的源代码,只是想从以下两段页面中提取内容和用户名,为了简单起见,它们靠近源代码的顶端.
content=”[Archive] Simburgur’s Live
Stream [Offline] Gears of War 3″
<div class="username">Simburgur</div>
这是我的代码在R:
doc <- htmlParse("http://forums.epicgames.com/archive/index.PHP/t-672775.html") xpathSApply(doc,"//head/Meta[@name=\"description\"]")
返回
[[1]] <Meta name="description" content="[Archive] Simburgur's Live Stream [Offline] Gears of War 3" />
显然,在这个例子中,我想要的内容是内容的引用内容,但是被卡住,似乎不能让我的表达式返回我想要的字符串.
我重复.我是XPath的新手.