cat bookmarks_2017_8_9.html | grep -o '\http[^\"]*\>"' \http[^\"]*\>" 分为三部分: \http :以http为开头 [^\"]* :排除掉字符串中的" \>" :以"结尾
-o 只显示匹配的字符串
bookmarks_2017_8_9.html的内容 > <DT><A HREF="https://gobyexample.com/" ADD_DATE="1485143885" > ICON="data:image/png;base64,C">Go by Example</A> 输出: > https://gobyexample.com/原文链接:https://www.f2er.com/regex/358119.html