资 源 简 介
具体实现思路:以4位数字的验证码为例 1、人工将验证码的4位数字每位对应的代码存入数据库中,每位存入0-9对应的代码,每个数可以多存这样可以提高识别率; 2、获取验证码以后,对其进行去背景、灰度处理、去噪点处理、分片处理以后生成每位数字对应的代码; 3、去背景色,这一步的目的是把验证码和背景颜色区别开来。4、去噪声:这一步要取出图像上的孤立点。这些孤立点被认为是噪声。 孤立点的定义:某个点,周围没有与该点等值的点。 或者某个连接块,该连接块的元素的个数小于某个给定值K, 把元素个数很小的连接块也定义为孤立点,有助于去处噪声。 去噪声算法:参照去背景算法。 5、图像锐化:图像锐化的目的是增强边界。这一步是可选的。看验证码的情况,这一步可以跳过。 6、图片有效区域截取:这个操作是将图片除验证码字符以外的边框去掉,只留下验证码字符图片,这样保证分片的准确性。 7、图片分片处理,这个处理是将整个图片分割成单个字符图片。8、拿分片图像生成的代码(eg:000111110011…..)与DB中已有代码相比较,取得相似度最高的即要验证码的字符; 注:如果DB的样本越多,识别的准确率也越高,但是速度会相应变慢