我通过xpath报废了一些html,然后我转化成了一个etree.类似的东西:
<td> text1 <a> link </a> text2 </td>
但是当我调用element.text时,我只得到text1(它必须在那里,当我在FireBug中检查我的查询时,元素的文本被突出显示,嵌入的锚元素之前和之后的文本…
解决方法
使用element.xpath(“string()”)或lxml.etree.tostring(element,method =“text”) – 请参见
the documentation.