import lxml.html t = lxml.html.fromstring("...") t.text_content()
而且如果你只是想清理lxml.html.clean module上的html看法