使用纯服务器端CSS和HTML解析这听起来非常困难 – 您必须重新创建浏览器的渲染引擎才能获得可靠的结果.
原文链接:https://www.f2er.com/php/136221.html根据你的需要,我可以想到沿着这些方向的某种方式:
>使用wget和–page-requisites之类的东西来获取页面和样式表
>然后:
>使用像Selenium这样的工具浏览每个下载的页面,搜索元素名称并输出它们的位置(如果可以在Selenium中使用.我认为它是,但我不确定)
>创建一个注入每个下载页面的jQuery. jQuery搜索名为“sidebar”,“toolbar”等的元素,获取其位置,将结果保存到本地AJAX片段,并继续下一个下载页面.您只需要在浏览器中打开第一页,其余的将自动发生.实现并非易事,但可能.
如果您可以使用.NET之类的客户端应用程序平台,那么构建包含浏览器控件的自定义应用程序可能会更容易,您可以比仅使用jQuery更自由地访问其DOM.