屏幕抓取 – 屏幕抓取器如何工作?

前端之家收集整理的这篇文章主要介绍了屏幕抓取 – 屏幕抓取器如何工作?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我听说人们一直在写这些程序,我知道他们做了什么,但他们是如何做到的呢?我正在寻找一般概念.

解决方法

从技术上讲,screenscraping是任何程序,它抓取另一个程序的显示数据并摄取它自己使用.

通常,屏幕截图是指解析目标网站的HTML页面提取格式化数据的Web客户端.当网站不提供RSS源或REST API以便以编程方式访问数据时,就可以完成此操作.

用于此目的的库的一个示例是Ruby的Hpricot,它是用于屏幕抓取的更好架构的HTML解析器之一.

猜你在找的HTML相关文章