python 識別圖片中的文字信息方法
最近朋友需要一個可以識別圖片中的文字的程序,以前做過java驗證碼識別的程序;
剛好最近在做一個python項目,所以順便用Python練練手
1.需要的環(huán)境:
2.7或者3.4版本的python
2.需要安裝pytesseract庫
依賴PIL和tesseract-ocr庫
本地環(huán)境是ubuntu,下面說一下 具體步驟:
2.7
1.安裝PIL:
直接使用pip 安裝; pip install Pillow
2.安裝tesseract-ocr:
apt-get install tesseract-ocr
3.安裝pytesseract
pip install pytesseract
使用python 3.4安裝時;將pip 命令修改為pip3(都知道)
測試:
import pytesseract from PIL import Image img = Image.open('hb1.png') data = pytesseract.image_to_string(img) print (data)
注意: 會出現亂碼
以上這篇python 識別圖片中的文字信息方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。