#符号 %r{} 可以用来替代正则表达式的边界斜线/xxx/
#encoding = utf-8
require 'open-uri'
test_text = "<title>百度一下,你就知道</title>"
url = 'http://www.baidu.com/'
page = open(url)
text = page.read
#puts text
puts text.match(/<html>/)
#符号 %{} 可以用来替代正则表达式的边界斜线/xxx/
def scrape_title(page)
page.match(%r{<title.*?>.*?</title\s*>}m)
end
puts scrape_title(test_text)
# .*? 和(.*?)表达的都是同一个意思,匹配任意字符,直到碰到第一个后面的表达式
puts "==============="
puts test_text.match(/<title.*?>(.*?)<\/title\s*>/)
puts "百度"