复制网站以供不使用JavaScript的离线视图(HTML和.js外部脚本标签)

我正在尝试复制一个网站以供离线查看而没有任何依赖性。

我想复制不带SCRIPT标签(特别是javascript)和不带外部脚本(.js)的HTML。

曾经尝试使用WGET --ignore-tags和HTTrack来执行此操作,但它没有按预期工作。脚本被整体复制。

xpxpxp27 回答:复制网站以供不使用JavaScript的离线视图(HTML和.js外部脚本标签)

通过Headless mode调用Chrome,例如chrome --headless --disable-gpu --dump-dom https://www.chromestatus.com/将不使用任何JavaScript转储呈现的DOM的HTML。

This post介绍了如何使用Headless Chrome和Puppeteer构建搜寻器。

本文链接:https://www.f2er.com/2998468.html

大家都在问