您的位置首页百科知识

Python验证码识别tesseract-ocr安装,报错解决

Python验证码识别tesseract-ocr安装,报错解决

的有关信息介绍如下:

Python验证码识别tesseract-ocr安装,报错解决

Tesseract-OCR是一款关于中文的识别,并且是开源的,识别效果比较好的软件包。

接下来给大家介绍Python验证码识别tesseract-ocr安装,报错解决。

首先需要下载tesseract-ocr

以下是下载地址

https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe

下载好后,双击tesseract-ocr-setup-4.00.00dev.exe安装,弹出欢迎界面,如下图所示

第二步,勾选【同意协议】,点击【next】即可

选择安装用户,选择勾选【全部用户】

选择安装功能,其他的默认即可,但是一定要选择这个语言包哦,这个语言包就是简体中文

选好安装目录后,点击【next】下一步

默认的点击下一步【next】,下一步【next】进行安装即可

安装完成后,点击下一步【next】即可,点击【finish】完成即可

最后一步,如果报错信息如下图所示,怎么办?

其实百度搜索有很多的解决方案,小编想说的是,小编亲自实践解决的一种方法,希望能有所帮助。

text = pytesseract.image_to_string(Image.open('C:\\Users\\123.png'), lang='chi_sim', config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')

在使用的时候,加上以下这段即可

config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'