过滤出HTML标签并解析python中的实体

前端之家收集整理的这篇文章主要介绍了过滤出HTML标签并解析python中的实体前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
因为正则表达式吓倒我,我试图找到一种方法删除所有HTML标签,并从Python中的字符串中解析HTML实体。

解决方法

使用 lxml这是python最好的xml / html库。
import lxml.html
t = lxml.html.fromstring("...")
t.text_content()

而且如果你只是想清理lxml.html.clean module上的html看法

猜你在找的HTML相关文章