正如标题所说,我有一些DOM操作任务.例如,我想:
– 找到所有具有蓝色的H1元素.
– 找到所有大小为12px的文本.
– 等..
– 找到所有具有蓝色的H1元素.
– 找到所有大小为12px的文本.
– 等..
我怎么能用Rails做到这一点?
谢谢.. :)
更新
我一直在做一些基于本文提取网页内容的研究 – > http://www.springerlink.com/index/A65708XMUR9KN9EA.pdf
该步骤的摘要是:
>获取我想要提取的网址(单个网页)
>根据一些视觉规则从网页中获取一些元素(例如:抓住所有具有蓝色的H1)
>使用我的算法处理元素
>将结果保存到我的数据库中.
-对不起,我的英语不好-
解决方法
如果你要做的是在rails应用程序中操作HTML文档,你应该看看
Nokogiri.
它使用XPath来搜索文档.通过以下内容,您可以在文档中找到任何带有“blue”css类的h1.
require 'nokogiri' require 'open-uri' doc = Nokogiri::HTML(open('http://www.stackoverflow.com')) doc.xpath('//h1/a[@class="blue"]').each do |link| puts link.content end
之后,如果您尝试做的事情确实在解析当前页面dom,那么您应该看看JavaScript和JQuery. Rails不能那样做.