Python實(shí)現(xiàn)輕松識(shí)別數(shù)百個(gè)快遞單號(hào)
大家好,我是小五
這是Python改變生活系列的第三篇,也是一個(gè)與你們有關(guān)的問(wèn)題案例。
前情提要
了解我的小伙伴可能都知道,小五經(jīng)常給大家送書(shū)。最近一年,不算聯(lián)合抽獎(jiǎng)送書(shū),單獨(dú)我自購(gòu)+出版社贊助已送出1000本書(shū)籍。
如果是自購(gòu)的話,還需要自己聯(lián)系快速小哥寄出書(shū)籍。
寄出后快遞小哥會(huì)給我截圖來(lái)反饋,然而我想要單號(hào)的時(shí)候就遇到問(wèn)題了。
每次寄完書(shū),我都只能得到n個(gè)截圖(內(nèi)含快遞信息)。
為了及時(shí)反饋大家物流信息,我需要盡快將快遞單號(hào)提取出來(lái)。
思考解決辦法
每次大概都有十幾到幾十張截圖,手動(dòng)去識(shí)別真的太麻煩。
不如先看看每張截圖大概是什么樣子,再去想想批量處理的辦法吧。
主要是為了批量獲取圖片中的快遞單號(hào),我想到了兩個(gè)解決辦法:
- 用python識(shí)別條形碼來(lái)直接獲得準(zhǔn)確快遞單號(hào)
- 用python調(diào)用ocr,識(shí)別截圖中的快遞單號(hào)文字
大家覺(jué)得哪個(gè)更簡(jiǎn)單更準(zhǔn)確呢?
今天我先聊聊第一種方法的流程和踩坑經(jīng)歷。
遍歷圖片
首先,第一步需要先獲取文件夾中的所有截圖,再依次進(jìn)行條形碼識(shí)別。
具體操作可以參考注釋
import?os def?get_jpg(): ????jpgs?=?[] ????path?=?os.getcwd() ????for?i?in?os.listdir(path):??#獲取文件列表 ????????if?i.split(".")[-1]?==?"jpg":??#篩選jpg文件(截圖) ????????????oldname=os.path.join(path,i)??#舊文件名 ????????????i?=?i.replace('微信圖片_','') ????????????newname=os.path.join(path,i)??#新文件名 ????????????os.rename(oldname,newname)??#改名 ????????????jpgs.append(i) ????return?jpgs
上面的代碼中除了遍歷篩選圖片,還涉及了改名的操作。
這是因?yàn)槲以诤竺媸褂?opencv 時(shí),打開(kāi)的路徑只要含有中文就會(huì)一直報(bào)錯(cuò),于是我就干脆把截圖名稱里的中文去除。
執(zhí)行構(gòu)建的get_jpg()
函數(shù),得到
這些就是演示文件中的四個(gè)截圖文件,下面開(kāi)始對(duì)他們進(jìn)行識(shí)別。
識(shí)別條形碼
python的第三方模塊 pyzbar
可以很方便地處理二維碼的識(shí)別。我們這次用它來(lái)識(shí)別一維條形碼的話,用法也大致一樣。不過(guò)還要搭配 cv2 使用,主要是為了利用cv2.imread()
來(lái)讀取圖片文件。
注意:對(duì)于cv2模塊,安裝時(shí)需要輸入pip3 install opencv-python
,但在導(dǎo)入的時(shí)候采用import cv2
。
識(shí)別條形碼的具體語(yǔ)句如下所示:
import?pyzbar.pyzbar?as?pyzbar import?cv2 def?get_barcode(img): ????image?=?cv2.imread(img) ????barcodes?=?pyzbar.decode(image) ????barcode?=?barcodes[0] ????barcode_data?=?barcode.data.decode("utf-8") ????return?barcode_data
上面構(gòu)建的get_barcode()
函數(shù)可以實(shí)現(xiàn)識(shí)別條形碼,并返回結(jié)果數(shù)據(jù)。
我們可以用for循環(huán)遍歷前文獲取的所有圖片,再依次使用get_barcode()
函數(shù)來(lái)識(shí)別條形碼。
data_m?=[] for?i?in?jpgs: ????data?=?get_barcode(i) ????data_m.append(data) data_m
可以發(fā)現(xiàn),成功識(shí)別了四張截圖里的條形碼,并獲取了對(duì)應(yīng)的快遞單號(hào)。
小結(jié)
回顧今天的問(wèn)題案例,我先通過(guò)思考想出了兩種解決辦法。第一種的優(yōu)點(diǎn)是識(shí)別條形碼比OCR更準(zhǔn)確,但是其只獲取了快遞單號(hào)。后續(xù)在給獲得贈(zèng)書(shū)的同學(xué)反饋時(shí),我還需要手動(dòng)將名字和單號(hào)對(duì)應(yīng),不夠偷懶。后續(xù)將給大家介紹第二種方法的流程和優(yōu)缺點(diǎn)。
以上就是Python實(shí)現(xiàn)輕松識(shí)別數(shù)百個(gè)快遞單號(hào)的詳細(xì)內(nèi)容,更多關(guān)于Python識(shí)別快遞單號(hào)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Python實(shí)現(xiàn)文件內(nèi)容批量追加的方法示例
這篇文章主要介紹了Python實(shí)現(xiàn)文件內(nèi)容批量追加的方法,結(jié)合實(shí)例形式分析了Python文件的讀寫(xiě)相關(guān)操作技巧,需要的朋友可以參考下2017-08-08Python?任務(wù)自動(dòng)化工具nox?的配置與?API詳情
這篇文章主要介紹了Python?任務(wù)自動(dòng)化工具nox?的配置與?API詳情,Nox?會(huì)話是通過(guò)被@nox.session裝飾的標(biāo)準(zhǔn)?Python?函數(shù)來(lái)配置的,具體詳情下文相關(guān)介紹需要的小伙伴可以參考一下2022-07-07Python類方法__init__和__del__構(gòu)造、析構(gòu)過(guò)程分析
這篇文章主要介紹了Python類方法__init__和__del__構(gòu)造、析構(gòu)過(guò)程分析,本文分析了什么時(shí)候構(gòu)造、什么時(shí)候析構(gòu)、成員變量如何處理、Python中的共享成員函數(shù)如何訪問(wèn)等問(wèn)題,需要的朋友可以參考下2015-03-03pytorch lstm gru rnn 得到每個(gè)state輸出的操作
這篇文章主要介紹了pytorch lstm gru rnn 得到每個(gè)state輸出的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05