抓取时隐藏的html源代码部分(python)

前端之家收集整理的这篇文章主要介绍了抓取时隐藏的html源代码部分(python)前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

所以我想从这个网址中抓取“买入价”整数:
https://rsbuddy.com/exchange?id=5502

但是当我查看源代码时,我无法达到这些价格. BeautifulSoup也没有刮刀.这是BeautifulSoup的输出

但是当我’使用chrome检查元素’时,我实际上能够看到这个价格:

为什么这部分代码“隐藏”了?是不是因为他们不希望别人从他们的网站上刮掉?
有办法解决这个问题吗?

提前致谢

编辑:
我通过使用Chrome工具跟踪javascript流量找到了答案.
显然即使api.rsbuddy.com没有给你任何东西,它确实使用了api:
https://api.rsbuddy.com/grandExchange?a=guidePrice&i=5502

最佳答案
价格可能是由JavaScript放在那里的.可能他们正在使用某种AJAX来获得价格.您将不得不调查他们的JavaScript以获取您想要的数据.

只是为了澄清,它本身并不是“隐藏”,它只是不在HTML中.当你检查元素时,它会查看由HTML所在的文档组成的文档以及JavaScript对它所做的任何更改.

猜你在找的HTML相关文章