java – 跟踪对网页内容的更改

前端之家收集整理的这篇文章主要介绍了java – 跟踪对网页内容的更改前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我需要跟踪网站内容的变化:我的用户有一个他们想要监控的网站列表,并在这些网站的内容更新时收到提醒.我知道有一些工具可以做到这一点:firefox插件,如check 4更改,更新扫描仪等.但是,我需要从我的应用程序执行此操作并将我的应用程序中受监控网站的任何更新报告给我用户.我怎么能用 javascript或java做到这一点?

解决方法

您可能想要的是一个Web爬虫,它在每个页面上运行快速diff或hash来检查更改.这是关于 Java Web爬虫库的问题: https://stackoverflow.com/questions/2495289/what-is-a-good-java-web-crawler-library

至于散列,MD5非常快,并且保证为不同的内容提供不同的散列(即使它只是略有不同). CRC甚至更快,但不太可靠.

如果这些都不适合你,希望搜索“{Java | Javascript}网络爬虫”会给你一些想法.

原文链接:https://www.f2er.com/java/129030.html

猜你在找的Java相关文章