亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python實現(xiàn)圖像識別的示例代碼

 更新時間:2021年03月22日 09:54:37   作者:先知丨先覺  
這篇文章主要介紹了python實現(xiàn)圖像識別的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

一、安裝庫

首先我們需要安裝PIL和pytesseract庫。
PIL:(Python Imaging Library)是Python平臺上的圖像處理標(biāo)準(zhǔn)庫,功能非常強大。
pytesseract:圖像識別庫。

我這里使用的是python3.6,PIL不支持python3所以使用如下命令

pip install pytesseract
pip install pillow

如果是python2,則在命令行執(zhí)行如下命令:

pip install pytesseract
pip install PIL

這時候我們?nèi)ミ\行上面的代碼會發(fā)現(xiàn)如下錯誤:

錯誤提示的很明顯:
No such file or directory :"tesseract"

這是因為我們沒有安裝tesseract-ocr引擎

二、tesseract-ocr引擎

光學(xué)字符識別(OCR,Optical Character Recognition)是指對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息的過程。OCR技術(shù)非常專業(yè),一般多是印刷、打印行業(yè)的從業(yè)人員使用,可以快速的將紙質(zhì)資料轉(zhuǎn)換為電子資料。關(guān)于中文OCR,目前國內(nèi)水平較高的有清華文通、漢王、尚書,其產(chǎn)品各有千秋,價格不菲。國外OCR發(fā)展較早,像一些大公司,如IBM、微軟、HP等,即使沒有推出單獨的OCR產(chǎn)品,但是他們的研發(fā)團隊早已掌握核心技術(shù),將OCR功能植入了自身的軟件系統(tǒng)。對于我們程序員來說,一般用不到那么高級的,主要在開發(fā)中能夠集成基本的OCR功能就可以了。這兩天我查找了很多免費OCR軟件、類庫,特地整理一下,今天首先來談?wù)凾esseract,下一次將討論下Onenote 2010中的OCR API實現(xiàn)。可以在這里查看OCR技術(shù)的發(fā)展簡史。
Tesseract的OCR引擎最先由HP實驗室于1985年開始研發(fā),至1995年時已經(jīng)成為OCR業(yè)內(nèi)最準(zhǔn)確的三款識別引擎之一。然而,HP不久便決定放棄OCR業(yè)務(wù),Tesseract也從此塵封。
數(shù)年以后,HP意識到,與其將Tesseract束之高閣,不如貢獻給開源軟件業(yè),讓其重?zé)ㄐ律?005年,Tesseract由美國內(nèi)華達州信息技術(shù)研究所獲得,并求諸于Google對Tesseract進行改進、消除Bug、優(yōu)化工作。

###安裝tesseract-ocr引擎

brew install tesseract

然后我們通過tesseract -v看一下是否安裝成成功

tesseract 3.05.01
leptonica-1.75.0
libjpeg 9b : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11

這時候我們運行上面代碼會出現(xiàn)亂碼


這是因為tesseract默認只有語言包中沒有中文包,如下圖:

###安裝tesseract-ocr語言包
我們?nèi)itHub下載我們需要的語言包,這里我只下載了chi_tra.traineddatachi_sim.traineddata
github:tesseract-ocr/tessdata
然后放到/usr/local/Cellar/tesseract/3.05.01/share/tessdata路徑下面。

可以通過tesseract --list-langs查看本地語言包:

可以通過tesseract --help-psm 查看psm

0:定向腳本監(jiān)測(OSD)
1: 使用OSD自動分頁
2 :自動分頁,但是不使用OSD或OCR(Optical Character Recognition,光學(xué)字符識別)
3 :全自動分頁,但是沒有使用OSD(默認)
4 :假設(shè)可變大小的一個文本列。
5 :假設(shè)垂直對齊文本的單個統(tǒng)一塊。
6 :假設(shè)一個統(tǒng)一的文本塊。
7 :將圖像視為單個文本行。
8 :將圖像視為單個詞。
9 :將圖像視為圓中的單個詞。
10 :將圖像視為單個字符。

為什么這里要強調(diào)語言包和psm,因為我們在使用中會用到,
比如多個語言包組合并且視為統(tǒng)一的文本塊將使用如下參數(shù):

pytesseract.image_to_string(image,lang="chi_sim+eng",config="-psm 6")

這里我們通過+來合并使用多個語言包。

接下來我們看一下配置好一切的正確結(jié)果。

import pytesseract
from PIL import Image

image = Image.open("../pic/c.png")
code = pytesseract.image_to_string(image,lang="chi_sim",config="-psm 6")
print(code)

 

此時大公告成。

到此這篇關(guān)于python實現(xiàn)圖像識別的示例代碼的文章就介紹到這了,更多相關(guān)python 圖像識別內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Django中FilePathField字段的用法

    Django中FilePathField字段的用法

    這篇文章主要介紹了Django中FilePathField字段的用法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-05-05
  • 教你使用Psycopg2連接openGauss的方法

    教你使用Psycopg2連接openGauss的方法

    Psycopg是一種用于執(zhí)行SQL語句的PythonAPI,可以為PostgreSQL、openGauss數(shù)據(jù)庫提供統(tǒng)一訪問接口,應(yīng)用程序可基于它進行數(shù)據(jù)操作,這篇文章主要介紹了教你使用Psycopg2連接openGauss的方法,需要的朋友可以參考下
    2022-11-11
  • python3.6.8 + pycharm + PyQt5 環(huán)境搭建的圖文教程

    python3.6.8 + pycharm + PyQt5 環(huán)境搭建的圖文教程

    這篇文章主要介紹了python3.6.8 + pycharm + PyQt5 環(huán)境搭建,本文通過圖文并茂的形式給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-06-06
  • python 基于selenium實現(xiàn)鼠標(biāo)拖拽功能

    python 基于selenium實現(xiàn)鼠標(biāo)拖拽功能

    這篇文章主要介紹了python 基于selenium實現(xiàn)鼠標(biāo)拖拽功能的方法,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2020-12-12
  • django框架創(chuàng)建應(yīng)用操作示例

    django框架創(chuàng)建應(yīng)用操作示例

    這篇文章主要介紹了django框架創(chuàng)建應(yīng)用操作,結(jié)合實例形式分析了Django框架的安裝、創(chuàng)建項目、創(chuàng)建數(shù)據(jù)庫及創(chuàng)建應(yīng)用相關(guān)操作技巧,需要的朋友可以參考下
    2019-09-09
  • 使用python?scrapy爬取天氣并導(dǎo)出csv文件

    使用python?scrapy爬取天氣并導(dǎo)出csv文件

    由于工作需要,將爬蟲的文件要保存為csv,以前只是保存為json,下面這篇文章主要給大家介紹了關(guān)于如何使用python?scrapy爬取天氣并導(dǎo)出csv文件的相關(guān)資料,需要的朋友可以參考下
    2022-08-08
  • Python實現(xiàn)的旋轉(zhuǎn)數(shù)組功能算法示例

    Python實現(xiàn)的旋轉(zhuǎn)數(shù)組功能算法示例

    這篇文章主要介紹了Python實現(xiàn)的旋轉(zhuǎn)數(shù)組功能算法,結(jié)合實例形式總結(jié)分析了數(shù)組旋轉(zhuǎn)算法的原理與實現(xiàn)技巧,需要的朋友可以參考下
    2019-02-02
  • Pytorch之parameters的使用

    Pytorch之parameters的使用

    今天小編就為大家分享一篇Pytorch之parameters的使用,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12
  • jupyter notebook 增加kernel教程

    jupyter notebook 增加kernel教程

    這篇文章主要介紹了jupyter notebook 增加kernel教程,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-04-04
  • Python實現(xiàn)獲取視頻時長功能

    Python實現(xiàn)獲取視頻時長功能

    這篇文章主要介紹了Python如何實現(xiàn)獲取視頻時長功能,可以精確到毫秒。文中的示例代碼簡潔易懂,對我們的學(xué)習(xí)有一定的幫助,感興趣的可以了解一下
    2021-12-12

最新評論