python – Scrapy解析javascript

前端之家收集整理的这篇文章主要介绍了python – Scrapy解析javascript前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我在页面上有一个 javascript,如下所示:
new Shopify.OptionSelectors("product-select",{ product: {"id":185310341,"title":"10. Design | Siyah \u0026 beyaz kalpli",

我想得到“185310341”.我在谷歌搜索了几个小时但找不到任何东西,我希望你能帮助我.我怎么能刮掉那个javascript并得到那个id?

我试过那段代码

id = sel.search('"id":(.*?),',text).group(1)
print id

但我得到了:

exceptions.AttributeError: 'Selector' object has no attribute 'search'

解决方法

Scrapy选择器的正则表达式为 built-in support
sel.xpath('<xpath_to_find_the_element_text>').re(r'"id":(\d+)')

演示显示这个特定正则表达式的工作:

>>> import re
>>> s = 'new Shopify.OptionSelectors("product-select",'
>>> re.search('"id":(\d+)',s).group(1)
'185310341'

猜你在找的Python相关文章