快捷导航
搜索
热搜: 活动 交友 discuz
查看: 67|回复: 0

Python+pytesseract+Tesseract-OCR图片文字验证码识别(适合新手) 安装失败

[复制链接]

229

主题

235

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
17813
发表于 2019-6-1 01:27:13 | 显示全部楼层 |阅读模式
最近看到群里不少人被这个问题折腾,所以写个教程给大家,大家可以按照步骤一步步去执行,亲测100%成功的。本人在多台不同版本的电脑上已经安装成功的了。

1. 首先安装Tesseract-OCR
可以google或者百度搜索,实在找不到可以到百度网盘下载:
https://pan.baidu.com/s/1Y7nLk5QKioK2DG5oxrMFlQ
下载后就直接安装, 安装时记住安装的路径,默认是在 C:\Program Files (x86)\Tesseract-OCR

2. 安装 pytesseract
使用pip命令安装
pip install pytesseract

3. 配置环境变量:
我的电脑 右键,点击属性
有个环境变量的选项:

11.PNG


然后添加一个环境变量:
名字叫:TESSDATA_PREFIX
它的值就是Tesseract-OCR安装路径
比如我的就是 C:\Program Files (x86)\Tesseract-OCR

12.PNG
4. 一般按照前三步就可以正常使用pytesseract了。
如果还是无法使用,那么可以找到文件 pytesseract.py,这个文件看你是安装的python2还是python3,
假如是python3,那么文件路径大概就是在  C:\python3_64\Lib\site-packages\pytesseract (具体位置根据你的python安装路径为准), 然后打开这个文件, 大概在28行的位置:


13.PNG
把这个tesseract_cmd的路径修改为  tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'


然后最重要的一部就是。 关掉你的pycharm或者IDE,或者cmd命令行。
重新打开pycharm或者新开一个cmd窗口, 然后运行一下pytesseract的识别代码,就可以正常识别拉。
from PIL import Image
im = Image.open('test_0.jpg')
pytesseract.image_to_string(im)











回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|创客大学堂

GMT+8, 2019-9-23 08:33 , Processed in 0.296017 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表