[VB.NET]求一个正则表达式处理一下html

前端之家收集整理的这篇文章主要介绍了[VB.NET]求一个正则表达式处理一下html前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

求一个正则表达式处理一下html
去除html中除链接标记之外的所有标记,即字符串中遇到象 <...> 这样的部分,如果其中包含href或/a则保留,其余删除
我原来是这么写的:
For Each m As Match In Regex.Matches(ss,<[^> ]*>,egexOptions.IgnoreCase)
If InStr(LCase(m.Value),href ) < 1 AndAlso LCase(m.Value) <> then
ss = Replace(ss,m.Value,)
End If
Next
不过我觉得这么作可能效率比较低,希望能通过一条正则表达式搞定。
__________________________________________________________________________
up
__________________________________________________________________________
顶顶...
__________________________________________________________________________
何必呢,那不会取出所有的 标签,而不是去除所有不是 的标签.
__________________________________________________________________________
我就是要去除所有不是
的标签
__________________________________________________________________________
我的意思是,用正则表达式,取出所有是
的内容.__________________________________________________________________________try <(?!(a/s|/a> ))[^> ]*?> __________________________________________________________________________

猜你在找的VB相关文章