OpenCV(python)版實現(xiàn)文本分割之水平投影法
對于如下一張圖片,如何將文本區(qū)域分割成一行一行的了?
在文本分割領域中有一種很優(yōu)秀的算法:投影法,包括水平投影法和垂直投影法。本文主要講述水平投影法,水平投影法可以理解為一束光線從圖像的左側向右邊進行照射,每一條光線可以理解為圖像的一行,計算每一行上圖像的黑色像素點,從而可以對圖像進行分割。
import numpy as np import cv2 def get_vvList(list_data): #取出list中像素存在的區(qū)間 vv_list=list() v_list=list() for index,i in enumerate(list_data): if i>0: v_list.append(index) else: if v_list: vv_list.append(v_list) #list的clear與[]有區(qū)別 v_list=[] return vv_list if __name__=='__main__': img_bgr=cv2.imread('./testImg/1.png',1) if not img_bgr is None: img=img_bgr.copy() img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #二值化 t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY) ''' 水平投影從左向右投射,計算每一行的黑色像素總數(shù) ''' rows,cols=binary.shape hor_list=[0]*rows for i in range(rows): for j in range(cols): #統(tǒng)計每一行的黑色像素總數(shù) if binary.item(i,j)==0: hor_list[i]=hor_list[i]+1 ''' 對hor_list中的元素進行篩選,可以去除一些噪點 ''' hor_arr=np.array(hor_list) hor_arr[np.where(hor_arr<5)]=0 hor_list=hor_arr.tolist() #繪制水平投影 img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255 for i in range(rows): pt1=(cols-1,i) pt2=(cols-1-hor_list[i],i) cv2.line(img_white,pt1,pt2,(0,),1) cv2.imshow('水平投影',img_white) cv2.waitKey(0) #取出各個文字區(qū)間 vv_list=get_vvList(hor_list) for i in vv_list: img_hor=img_bgr[i[0]:i[-1],:,:] cv2.imshow('文本行',img_hor) cv2.waitKey(0)
運行上述代碼,可以看到水平投影的效果。
根據(jù)投影法的特征,可以很容易就將上述文本分割成文本行,如下圖所示:
到此這篇關于OpenCV(python)版實現(xiàn)文本分割之水平投影法的文章就介紹到這了,更多相關OpenCV水平投影 內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
探索Python庫coconut輕松地編寫函數(shù)式代碼實例
本文將介紹Python Coconut的基本概念、語法特性和實際應用,同時提供豐富的示例代碼,以幫助大家更好地理解和應用這個強大的工具2024-01-01pyinstaller打包python3.6和PyQt5中各種錯誤的解決方案匯總
pyinstaller是打包python很方便的一個套件,我們可以很輕易地使用他,下面這篇文章主要給大家介紹了關于pyinstaller打包python3.6和PyQt5中各種錯誤解決的相關資料,需要的朋友可以參考下2022-08-08Python連接MySQL并使用fetchall()方法過濾特殊字符
這篇文章主要介紹了Python連接MySQL的方法并講解了如何使用fetchall()方法過濾特殊字符,示例環(huán)境為Ubuntu操作系統(tǒng),需要的朋友可以參考下2016-03-03Python制作數(shù)據(jù)預測集成工具(值得收藏)
這篇文章主要介紹了Python如何制作數(shù)據(jù)預測集成工具,幫助大家進行大數(shù)據(jù)預測,感興趣的朋友可以了解下2020-08-08