python图形验证码模块tesserocr
ocr图片识别通常可以利用tesserocr模块,将图片中内容识别出来并转换为text并输出
Tesserocr是python的一个OCR识别库,是对tesseract做的一层python APT封装。在安装Tesserocr前,需要先安装tesseract
tessrtact文件:
https://digi.bib.uni-mannheim.de/tesseract/
python安装tessocr: 下载对应的.whl文件安装(这个包pip方式容易出错)
tesseract 与对应的tesserocr:
https://github.com/simonflueckiger/tesserocr-windows_build/releases
实现代码如下:
from PIL import Image
import tesserocr
#tesserocr识别图片的2种方法
img = Image.open("code.jpg")
verify_code1 = tesserocr.image_to_text(img)
#print(verify_code1)
verify_code2 = tesserocr.file_to_text("code.jpg")
#print(verify_code2)
但是,当图片中干扰部分较多,如验证码内多余的线条干扰图片的识别,识别后的内容不是很准确,就需要做一下处理,如转灰度,二值化操作。
可以利用Image对象的convert()方法,传入“L”,将图片转为灰度图像;传入1则对图像进行二值处理(默认阈值127)
原验证码:
img = Image.open("code.jpg")
img_L = img.convert("L")
img_L.show()
也可以自己设置阈值
threshold = 100 #设置二值的阈值100
table = []
for i in range(256):
if i < threshold:
table.append(0)
else:
table.append(1)
#point()返回给定查找表对应的图像像素值的拷贝,变量table为图像的每个通道设置256个值,为输出图像指定一个新的模式,模式为“L”和“P”的图像进一步转换为模式为“1”的图像
image = img_L.point(table, "1")
image.show()
img_1 = tesserocr.image_to_text(image)
print(img_1)
>>5SA6
操作系统:Win10 1709 X64
python版本:3.6.5
依赖模块:PIL、tesserocr。
需要说明的是,在windows系统上PowerShell通过PIP3 install tesserocr安装验证码识别模块时,需要先安装Tesseract (一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强。)可执行文件。
以中国知网的注册页面为例,我们常被要求输入这类简单的字母组成,背景含很多杂线的验证码,如下图所示:
我们对验证码另存为到本地代码所在目录,取名:test.png.
下图是直接用对应模块识别的代码示例:
1 2 3 4 5 6 |
import tesserocr from PIL import Image image=Image.open('test.png') image.show() #可以打印出图片,供预览 print(tesserocr.image_to_text(image)) |
---|
原始图片尺寸较小,极少情况下如果无法正常识别,可以借助图片处理工具PIL模块进行图片等比例放大后保存。此例中直接运行上述代码,结果为“VHIHI”,即使是肉眼可见较为清晰的验证码,如果图片未经处理直接交由tesserocr解析,也可能识别率很低。
通常情况下,我们还需要做些额外的图片处理,如转灰度图,二值化等。
利用Image对应的convert()方法传参L,即可将图片转为灰度图。
image=image.convert('L')
image.show()
传入1即可完成二值化,如下:
image=image.convert('1')
image.show()
当然我们更多时候需要根据图片的实际情况指定二值化的阈值,比如我们将阈值设定为80,先转灰度图,再二值化,代码如下:
import tesserocr
from PIL import Image
image=Image.open('test.png')
image=image.convert("L")
threshold=80
table=[]
for i in range(256):
if i <threshold:
table.append(0)
else:
table.append(1)
image=image.point(table,'1')
image.show()
print(tesserocr.image_to_text(image))
观察到处理后图片如右:
尽管图片已经转为灰度图,且过滤了大部分杂线,但是图片关键像素丢失严重,识别结果自然也不尽如人意,结果:“VH.”。
此时我们根据图片的实际情况,人为调整程序中预设的阈值到130,再观察:
,这次的图片转换效果显著,我们再次查看识别结果,“VHRU”,与肉眼观察到的别无二致,合乎要求。
可见验证码的识别除了用好识别模块,还需要在必要时引入PIL(图片处理模块)进行图片预处理,预处理过程中的阈值等设定也存有技巧,不同的参数设定,会完全影响最终的识别率。
现实中很多网站的验证码要远比例子中的来得复杂,尤其是12306购票网站的验证码,使行为验证码开始高速发展,肉眼分辨起来都异常困难,这就要求我们对验证码的识别技术要不断提升,才能突破网站逐步升级的反爬虫机制。
- WCF技术剖析之二十四: ServiceDebugBehavior服务行为是如何实现异常的传播的?
- Linux64位程序移植
- history命令使用方法详解
- Linux删除乱码文件的方法
- 和智能机器一起工作,而不是惧怕它们
- Hulu大数据架构与应用经验
- SQL Server 2005:一个使用新创建的User的问题和解决方法
- Audit Logging-Stored Procedure
- Linux进程间通信(四) - 共享内存
- 扩展UltraGrid控件实现对所有数据行的全选功能[Source Code下载]
- Linux进程间通信(一) - 管道
- Linux进程间通信(二) - 消息队列
- Linux进程间通信(三) - 信号
- 我的WCF之旅(7):面向服务架构(SOA)和面向对象编程(OOP)的结合——如何实现Service Contract的继承
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- codeforces 1374D(数学)
- Yet Another Walking Robot (Map)
- HDU 1059(多重背包)
- 扩散(二分答案+并查集)
- JAVA入门学习十二
- YOLO算法最全综述:从YOLOv1到YOLOv5
- codeforce893C (并查集)
- codeforces 544C(完全背包求方案数)
- SCU2511(单调栈)
- B. Ternary String(贪心)
- codeforces 940B(贪心)
- codeforces 429A(dfs)
- codeforces 1182B (DFS)
- codeforces 509B(构造,思维)
- codeforces 1257C(map)