pythonxypython

发布时间: 2023-10-31 10:44:39

‘壹’ python如何图像识别

Python图片文本识别使用的工具是PIL和pytesser。因为他们使用到很多的python库文件，为了避免一个个工具的安装，建议使用pythonxy
pytesser是OCR开源项目的一个模块，在Python中导入这个模块即可将图片中的文字转换成文本。pytesser调用了tesseract。当在Python中调用pytesser模块时，pytesser又用tesseract识别图片中的文字。pytesser的使用步骤如下：

首先，安装Python2.7版本，这个版本比较稳定，建议使用这个版本。
其次，安装pythoncv。
然后，安装PIL工具，pytesser的使用需要PIL库的支持。
接着下载pytesser
最后，将pytesser解压，这个是免安装的，可以将解压后的文件cut到Python安装目录的Lib\site-packages下直接使用，比如我的安装目录是：C:\Python27\Lib\site-packages，同时把这个目录添加到环境变量之中。
完成以上步骤之后，就可以编写图片文本识别的Python脚本了。参考脚本如下：
from pytesser import *
import ImageEnhance
image = Image.open('D:\\workspace\\python\\5.png')
#使用ImageEnhance可以增强图片的识别率
enhancer = ImageEnhance.Contrast(image)
image_enhancer = enhancer.enhance(4)
print image_to_string(image_enhancer)

tesseract是谷歌的一个对图片进行识别的开源框架，免费使用，现在已经支持中文，而且识别率非常高，这里简要来个helloworld级别的认识
下载之后进行安装，不再演示。
在tesseract目录下，有个tesseract.exe文件，主要调用这个执行文件，用cmd运行到这个目录下，在这个目录下同时放置一张需要识别的图片，这里是123.jpg
然后运行:tesseract 123.jpg result
会把123.jpg自动识别并转换为txt文件到result.txt
但是此时中文识别不好
然后找到tessdata目录，把eng.traineddata替换为chi_sim.traineddata,并且把chi_sim.traineddata重命名为eng.traineddata
ok,现在中文识别基本达到90%以上了

阅读全文

热点内容

php二维数组拆分发布：2025-03-05 00:33:24 浏览：197

游猴脚本发布：2025-03-05 00:33:20 浏览：515

微信存储的文档发布：2025-03-05 00:31:42 浏览：229

c语言中基本的数据类型包括发布：2025-03-05 00:30:55 浏览：708

安卓小组件哪个好用发布：2025-03-05 00:30:20 浏览：340

安卓如何下载录屏精灵发布：2025-03-05 00:15:22 浏览：485

攻城掠地怎么开服务器发布：2025-03-05 00:11:31 浏览：482

怎么看汉兰达什么配置发布：2025-03-05 00:08:29 浏览：282

服务器装系统如何加载硬盘驱动发布：2025-03-04 23:59:50 浏览：151

vf编程语言发布：2025-03-04 23:54:17 浏览：179

pythonxypython

与pythonxypython相关的资讯