关于旋转的话只能先找出旋转的规律,通常来说不太可能360度随意旋转的。就算是360度那也就是每个字多增加360次的判断罢了。将这些特征码都扔到数据库里也不是很麻烦。其实这样算下来的话这个库应该也不会上百万。在处理大型的数据库的时候上千万和上亿的数据也是正常。就算做个MSN机器人的话数据库都不见得比这个小。不要被各类特征吓坏了……其实最终的,最笨的方法还是就是直接收集特征码,不然我也不会说剩下的都是体力活,而不是脑力活了。
当看到一个验证码的时候就是先找出规律,而不是头大。就我现在感觉的话QQ的中文验证这块还算是可以处理的,必竟这个字体还处于可识别的,像现在我在弄QQ华夏的验证码,那个真叫变态。两个数字重叠,我现在做的话只能达到80%的识别,而无法达到100%的识别。因为太变态了,数据旋转无规律,无规律就算了,两个数字经常重叠在一起。而且重叠的时候根本就无法分,现在单找这个规律就浪费了我N多的时间。郁闷……
