前端之家收集整理的这篇文章主要介绍了
golang Html 正则,
前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
原文链接:http://outofmemory.cn/code-snippet/2092/usage-golang-regular-expression-regexp-quchu-HTML-css-SCRIPT-code-jin-maintain-page-wenzi
package main
import (
"fmt""io/IoUtil""net/http""regexp""strings"
)
func main(){
resp, err := http.Get("http://www.baidu.com"
// resp,err := http.Get("http://www.163.com")
if!= nil
fmtPrintln"http get error."
}
defer respBodyClose
body IoUtilReadAllresp
"http read error"
src stringbody
//将HTML标签全转换成小写
re _ regexpCompile"\\<[\\S\\s]+?\\>"
src = reReplaceAllStringFuncsrc stringsToLower//去除STYLE "\\<style[\\S\\s]+?\\</style\\>"ReplaceAllString ""//去除SCRIPT "\\<script[\\S\\s]+?\\</script\\>"//去除所有尖括号内的HTML代码,并换成换行符 "\n"//去除连续的换行符 "\\s{2,}"
fmtstringsTrimSpace))}