我正在尝试复制一个网站以供离线查看而没有任何依赖性。
我想复制不带SCRIPT标签(特别是javascript)和不带外部脚本(.js)的HTML。
曾经尝试使用WGET --ignore-tags
和HTTrack来执行此操作,但它没有按预期工作。脚本被整体复制。
我正在尝试复制一个网站以供离线查看而没有任何依赖性。
我想复制不带SCRIPT标签(特别是javascript)和不带外部脚本(.js)的HTML。
曾经尝试使用WGET --ignore-tags
和HTTrack来执行此操作,但它没有按预期工作。脚本被整体复制。
通过Headless mode调用Chrome,例如chrome --headless --disable-gpu --dump-dom https://www.chromestatus.com/
将不使用任何JavaScript转储呈现的DOM的HTML。
This post介绍了如何使用Headless Chrome和Puppeteer构建搜寻器。