一个12306验证码破解思路, 图片采集 + 概率
//分析: 1. 单次验证码里面有8个图片,类型最多8种,最少不太确定 2. 8个图是规则排列,可以很容易分隔 3. 图片库应该是有限的,可以采集,计算hash入库,这里需要关联相同类型图片 (比如 “杯子”,“刷子”等) 备注:这里的图片hash并不是md5,有很多算法,自行搜索吧。
//下面,我假设图片已经采集好了,分类也完成了,开始进行识别:
-
选一张验证码,分隔成8个图片,分别计算hash,然后查询 这些hash对应的
类型(比如 “杯子”,“刷子”等),这里 假设图片识别正确率 100% -
随机选择一个上一步中查询到的类型,点击相应位置。 这里不需要识别上面的
汉字,按概率来说,极端情况,8个图片都不同,随机选择正确率 12.5%。于是,
理论上尝试8次以内,就能成功登录。
//难点:
//一些增加识别难度的建议
// 仅仅凭借以往经验的一些思路,尚未实践。欢迎吐槽...