ruby – 使用Mechanize gem根据它们在DOM中的位置返回链接集合

前端之家收集整理的这篇文章主要介绍了ruby – 使用Mechanize gem根据它们在DOM中的位置返回链接集合前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在努力机械化.我希望“点击”一组链接,这些链接只能通过它们的位置(div#content中的所有链接)或它们的href来识别.

我已经尝试过上述两种识别方法但没有成功.

从文档中,我无法弄清楚如何根据它们在DOM中的位置返回链接集合(用于单击),而不是直接在链接上返回属性.

其次,documentation建议你可以使用:href来匹配部分href,

page = agent.get('http://foo.com/').links_with(:href => "/something")

但我唯一可以让它返回链接方法是传递一个完全限定的URL,例如

page = agent.get('http://foo.com/').links_with(:href => "http://foo.com/something/a")

如果我想返回带有href的链接集合,这不是很有用

http://foo.com/something/a
http://foo.com/something/b
http://foo.com/something/c
etc...

难道我做错了什么?我有不切实际的期望吗?

解决方法

第二部分
您传递给的值:href默认情况下必须是完全匹配.因此,示例中的href仅匹配< a href =“/ something”>< / a>而不是< a href =“foo.com/something/a”>< / a>

你想要做的是传入一个正则表达式,以便它匹配href字段中的子字符串.像这样:

page = agent.get('http://foo.com/').links_with(:href => %r{/something/})

编辑:
第一部分
要使其仅在链接中选择链接,请在字符串中添加nokogiri样式的搜索方法.像这样:

page = agent.get('http://foo.com/').search("div#content").links_with(:href => %r{/something/})    # **

好吧,这不起作用,因为在你执行page = agent.get(‘http://foo.com/’).search(“div #content”)后,你会得到一个Nokogiri对象而不是机械对象,所以links_with不起作用.但是,您将能够使用css方法从Nokogiri对象中提取链接.我会建议像:

page = agent.get(‘http://foo.com/’).search(“div#content”).css(“a”)

如果这不起作用,我建议查看http://nokogiri.org/tutorials

猜你在找的Ruby相关文章