侯体宗的博客
  • 首页
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

Python2实现的图片文本识别功能详解

Python  /  管理员 发布于 7年前   156

本文实例讲述了Python2实现的图片文本识别功能。分享给大家供大家参考,具体如下:

这里需要用到python的几个库,分别是pytesser,以及pytesser的依赖库PIL。python的版本建议用2.7或者2.7一下的都行,不建议用python3以上的,因为python3不向下兼容,所以有很多python2的东西它不支持

pytesser下载的话,我直接在pycharm里面下全是失败,用DOS的命令行下也是失败,所以还是自己直接去google下吧
地址:http://code.google.com/p/pytesser/downloads/list

如果打不开上面的网址的话可以从我的资源里面下载,点击此处本站下载。

下载好了之后安装,步骤:

1.  解压pytesser ,将解压后的文件复制到Python安装目录的Lib\site-packages下,直接使用,比如我的安装目录是:C:\Python27\Lib\site-packages。

2. 这里我建立好的pytesser目录为C:\Python27\Lib\site-packages\pytesser\

3. 接下来打开pytesser文件夹,将pytesser.py修改成__init__.py,然后打开py文件进行修改:
①. import Image 改为: from PIL import Image
②. tesseract_exe_name = 'tesseract' ―> tesseract_exe_name = 'C:\\Python27\\Lib\\site-packges\\pytesser\\tesseract,注意双斜杠,否则可能因为转义字符报错

接下来就是下载PIL了。这个我在pycharm里面也是下载失败,提示没有找到适合python版本的PIL。
可以在DOS命令行下用命令下:pip install Pillow 这里要注意的是如果要直接在DOS下用pip命令的话要先把pip的路径加到环境变量path里面去,例如我的pip路径:“D:\python2.7.13\Scripts\”

注:小编尝试后发现PIL安装很麻烦,推荐下载exe直接安装

具体可至PIL官网查找对应安装版本:http://pythonware.com/products/pil/

全部下载完之后就可以开始拿图片测试了。这里我们先拿上面下载的pytesser压缩包里面给的测试图片来测试
代码如下:

from pytesser import *img=Image.open("D:\\fnord.tif") #我这里是直接把图片复制在d盘下。可以随意更改。如果是d盘下的XX文件夹,路径就是:d:\XX\\fnord.tif#一些对python不熟悉的小伙伴要注意的是这个路径只有最后一个斜杠要改成双斜杠,前面的都是单斜杠,如果不是这样的话在pycharm里面就会报一些看不懂的错误,百度到死都不知道怎么解决。print image_to_string(img)

或者可以写成:

print image_file_to_string("D:\\fnord.tif")

这里需要注意一下,直接运行上面的代码的话可能会报一个找不到Image类的错误,具体我也不是很清楚,可能是因为pytesser只支持PIL的Image类吧,因此我们还要改一个东西,就是上面步骤3中pytesser包里面__init__.py 文件的第一行:import Image改成from PIL import Image。如图:

 

这时候就可以看到输出结果:

 

大功告成。

最后说一下这个方法的一些缺点,就是识别率不高,要图片里面的文字很清晰才可以识别出来,要想提高识别率的话还要对图片进行一些操作,这里就不详细说啦,请大家自行百度。

更多关于Python相关内容可查看本站专题:《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。


  • 上一条:
    利用Python如何制作好玩的GIF动图详解
    下一条:
    利用Python进行数据可视化常见的9种方法!超实用!
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 在windows10中升级go版本至1.24后LiteIDE的Ctrl+左击无法跳转问题解决方案(0个评论)
    • 智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客