人臉檢測(cè)實(shí)戰(zhàn)終極之OpenCV+Python實(shí)現(xiàn)人臉對(duì)齊
前言
這篇博文的目的是演示如何使用 OpenCV、Python 和面部標(biāo)志對(duì)齊人臉。
給定一組面部標(biāo)志(輸入坐標(biāo)),我們的目標(biāo)是將圖像扭曲并轉(zhuǎn)換為輸出坐標(biāo)空間。
在這個(gè)輸出坐標(biāo)空間中,整個(gè)數(shù)據(jù)集中的所有面都應(yīng)該:
- 在圖像中居中。
- 旋轉(zhuǎn),使眼睛位于水平線上(即,旋轉(zhuǎn)面部,使眼睛位于相同的 y 坐標(biāo)上)。
- 進(jìn)行縮放,使面的大小大致相同。
為此,我們將首先調(diào)用一個(gè)實(shí)現(xiàn)的 Python 類FaceAligner ,以使用仿射變換對(duì)齊人臉。
注意:仿射變換用于旋轉(zhuǎn)、縮放、平移等。我們可以將上述所有三個(gè)要求打包到一個(gè) cv2.warpAffine 調(diào)用中; 訣竅是創(chuàng)建旋轉(zhuǎn)矩陣 M 。
然后,我們將創(chuàng)建一個(gè)示例驅(qū)動(dòng)程序 Python 腳本來接受輸入圖像、檢測(cè)人臉并對(duì)齊它們。
最后,我們將回顧我們使用 OpenCV 過程進(jìn)行人臉對(duì)齊的結(jié)果。
實(shí)現(xiàn)面部矯正器
面部對(duì)齊算法本身基于 Mastering OpenCV with Practical Computer Vision Projects (Baggio, 2012) 的第 8 章,如果您有 C++ 背景或興趣,我強(qiáng)烈推薦它。 本書在 GitHub 上提供了開放訪問的代碼示例。
新建facealigner.py實(shí)現(xiàn)FaceAligner類。
# import the necessary packages from imutils.face_utils.helpers import FACIAL_LANDMARKS_68_IDXS from imutils.face_utils.helpers import FACIAL_LANDMARKS_5_IDXS from imutils.face_utils.helpers import shape_to_np import numpy as np import cv2 class FaceAligner: def __init__(self, predictor, desiredLeftEye=(0.35, 0.35), desiredFaceWidth=256, desiredFaceHeight=None): # store the facial landmark predictor, desired output left # eye position, and desired output face width + height self.predictor = predictor self.desiredLeftEye = desiredLeftEye self.desiredFaceWidth = desiredFaceWidth self.desiredFaceHeight = desiredFaceHeight # if the desired face height is None, set it to be the # desired face width (normal behavior) if self.desiredFaceHeight is None: self.desiredFaceHeight = self.desiredFaceWidth
導(dǎo)入必要的包
定義的構(gòu)造函數(shù)開始我們的 FaceAligner 類。
我們的構(gòu)造函數(shù)有 4 個(gè)參數(shù):
- predictor :面部標(biāo)志性預(yù)測(cè)器模型。
- requiredLeftEye :一個(gè)可選的 (x, y) 元組,顯示默認(rèn)值,指定所需的輸出左眼位置。對(duì)于此變量,通常會(huì)看到 20-40% 范圍內(nèi)的百分比。這些百分比控制對(duì)齊后人臉的可見程度。使用的確切百分比將因應(yīng)用程序而異。使用 20% 時(shí),您基本上會(huì)獲得“放大”的臉部視圖,而使用較大的值時(shí),臉部會(huì)顯得更“縮小”。
- requiredFaceWidth :另一個(gè)可選參數(shù),以像素為單位定義我們想要的人臉。我們將此值默認(rèn)為 256 像素。
- requiredFaceHeight :最后一個(gè)可選參數(shù),以像素為單位指定我們所需的人臉高度值。
接下來,讓我們決定是想要一張方形的人臉圖像還是矩形的圖像。檢查 requiredFaceHeight 是否為 None ,如果是,我們將其設(shè)置為 desiredFaceWidth ,這意味著面部是方形的。方形圖像是典型情況?;蛘撸覀兛梢詾?desiredFaceWidth 和 desiredFaceHeight 指定不同的值以獲得感興趣的矩形區(qū)域。
現(xiàn)在我們已經(jīng)構(gòu)建了我們的 FaceAligner 對(duì)象,接下來我們將定義一個(gè)對(duì)齊人臉的函數(shù)。
這個(gè)函數(shù)有點(diǎn)長,所以我把它分成了 5 個(gè)代碼塊,讓它更容易理解:
def align(self, image, gray, rect): # convert the landmark (x, y)-coordinates to a NumPy array shape = self.predictor(gray, rect) shape = shape_to_np(shape) # extract the left and right eye (x, y)-coordinates (lStart, lEnd) = FACIAL_LANDMARKS_IDXS["left_eye"] (rStart, rEnd) = FACIAL_LANDMARKS_IDXS["right_eye"] leftEyePts = shape[lStart:lEnd] rightEyePts = shape[rStart:rEnd]
定義了 align 函數(shù),它接受三個(gè)參數(shù):
image : RGB 輸入圖像。
gray :灰度輸入圖像。
rect :由 dlib 的 HOG 人臉檢測(cè)器生成的邊界框矩形。
應(yīng)用 dlib 的面部標(biāo)志預(yù)測(cè)器并將標(biāo)志轉(zhuǎn)換為 NumPy 格式的 (x, y) 坐標(biāo)。
接下來,從 helpers.py 腳本中找到的 FACIAL_LANDMARK_IDXS 字典中讀取 left_eye 和 right_eye 區(qū)域。 這些 2 元組值存儲(chǔ)在左/右眼開始和結(jié)束索引中。
提取leftEyePts 和 rightEyePts 。
接下來,計(jì)算每只眼睛的中心以及眼睛質(zhì)心之間的角度。
這個(gè)角度是對(duì)齊我們的圖像的關(guān)鍵組成部分。
眼睛之間的綠線夾角,如下圖所示,是我們比較關(guān)心的。
接下來是角度計(jì)算:
# compute the center of mass for each eye leftEyeCenter = leftEyePts.mean(axis=0).astype("int") rightEyeCenter = rightEyePts.mean(axis=0).astype("int") # compute the angle between the eye centroids dY = rightEyeCenter[1] - leftEyeCenter[1] dX = rightEyeCenter[0] - leftEyeCenter[0] angle = np.degrees(np.arctan2(dY, dX)) - 180
分別通過平均每只眼睛的所有 (x, y) 點(diǎn)來計(jì)算每只眼睛的質(zhì)心,也稱為質(zhì)心。
給定眼睛中心,我們可以計(jì)算 (x, y) 坐標(biāo)的差異并取反正切以獲得眼睛之間的旋轉(zhuǎn)角度。
這個(gè)角度將允許我們校正旋轉(zhuǎn)。
為了確定角度,我們首先計(jì)算 y 方向的增量 dY 。 這是通過在第 38 行找到 rightEyeCenter 和 leftEyeCenter 之間的差異來完成的。
類似地,我們計(jì)算 dX ,即第 39 行 x 方向的增量。
接下來,我們計(jì)算面部旋轉(zhuǎn)的角度。 我們使用帶有參數(shù) dY 和 dX 的 NumPy 的 arctan2 函數(shù),然后轉(zhuǎn)換為度數(shù),同時(shí)減去 180 以獲得角度。
在以下代碼塊中,我們計(jì)算所需的右眼坐標(biāo)(作為左眼位置的函數(shù))并計(jì)算新結(jié)果圖像的比例。
# compute the desired right eye x-coordinate based on the # desired x-coordinate of the left eye desiredRightEyeX = 1.0 - self.desiredLeftEye[0] # determine the scale of the new resulting image by taking # the ratio of the distance between eyes in the *current* # image to the ratio of distance between eyes in the # *desired* image dist = np.sqrt((dX ** 2) + (dY ** 2)) desiredDist = (desiredRightEyeX - self.desiredLeftEye[0]) desiredDist *= self.desiredFaceWidth scale = desiredDist / dist
根據(jù)所需的左眼 x 坐標(biāo)計(jì)算所需的右眼。從 1.0 中減去 self.desiredLeftEye[0] 因?yàn)樗璧腞ightEyeX 值應(yīng)該與圖像的右邊緣等距,因?yàn)橄鄳?yīng)的左眼 x 坐標(biāo)與其左邊緣的距離相同。
然后可以通過獲取當(dāng)前圖像中眼睛之間的距離與所需圖像中眼睛之間的距離的比率來確定人臉的比例
首先,計(jì)算歐幾里得距離比 dist 。
接下來,使用左右眼 x 值之間的差異,計(jì)算所需的距離,desiredDist。
通過在第 52 行乘以所需的面寬來更新所需的距離。這實(shí)質(zhì)上是根據(jù)所需的寬度縮放的眼睛距離。
最后,比例是通過將 desiredDist 除以我們之前計(jì)算的 dist 來計(jì)算的。
現(xiàn)在有了旋轉(zhuǎn)角度和比例,需要在計(jì)算仿射變換之前采取一些步驟。這包括找到眼睛之間的中點(diǎn)以及計(jì)算旋轉(zhuǎn)矩陣并更新其平移分量:
# compute center (x, y)-coordinates (i.e., the median point) # between the two eyes in the input image eyesCenter = (int((leftEyeCenter[0] + rightEyeCenter[0]) // 2), int((leftEyeCenter[1] + rightEyeCenter[1]) // 2)) # grab the rotation matrix for rotating and scaling the face M = cv2.getRotationMatrix2D(eyesCenter, angle, scale) # update the translation component of the matrix tX = self.desiredFaceWidth * 0.5 tY = self.desiredFaceHeight * self.desiredLeftEye[1] M[0, 2] += (tX - eyesCenter[0]) M[1, 2] += (tY - eyesCenter[1])
計(jì)算 eyeCenter ,即左右眼之間的中點(diǎn)。 這將用于我們的旋轉(zhuǎn)矩陣計(jì)算。 本質(zhì)上,這個(gè)中點(diǎn)位于鼻子的頂部,是我們將面部旋轉(zhuǎn)的點(diǎn):
為了計(jì)算旋轉(zhuǎn)矩陣 M ,我們使用 cv2.getRotationMatrix2D 指定 eyeCenter 、角度和比例。這三個(gè)值中的每一個(gè)都先前已計(jì)算過,因此請(qǐng)根據(jù)需要返回。
cv2.getRotationMatrix2D 的參數(shù)說明如下:
- eyeCenter :眼睛之間的中點(diǎn)是我們將圍繞面部旋轉(zhuǎn)的點(diǎn)。
- angle:我們將面部旋轉(zhuǎn)到的角度,以確保眼睛位于同一水平線上。
- scale :我們將放大或縮小圖像的百分比,確保圖像縮放到所需的大小。
現(xiàn)在必須更新矩陣的平移分量,使人臉在仿射變換后仍然在圖像中。
取所需面寬的一半并將值存儲(chǔ)為 tX,即 x 方向的平移。
為了計(jì)算 tY ,y 方向的平移,將所需的面部高度乘以所需的左眼 y 值,desiredLeftEye[1]。
使用 tX 和 tY ,通過從它們對(duì)應(yīng)的眼睛中點(diǎn)值(第 66 行和第 67 行)中減去每個(gè)值來更新矩陣的平移分量。
然后應(yīng)用仿射變換來對(duì)齊人臉:
# apply the affine transformation (w, h) = (self.desiredFaceWidth, self.desiredFaceHeight) output = cv2.warpAffine(image, M, (w, h), flags=cv2.INTER_CUBIC) # return the aligned face return output
為方便起見,將 desiredFaceWidth 和 desiredFaceHeight 分別存儲(chǔ)到 w 和 h 中(第 70 行)。
然后調(diào)用 cv2.warpAffine 執(zhí)行最后一步。 此函數(shù)調(diào)用需要 3 個(gè)參數(shù)和 1 個(gè)可選參數(shù):
- image : 人臉圖像。
- M :平移、旋轉(zhuǎn)和縮放矩陣。
- (w, h) :輸出面所需的寬度和高度。
- flags :用于扭曲的插值算法,在本例中為 INTER_CUBIC 。 要了解其他可能的標(biāo)志和圖像轉(zhuǎn)換,請(qǐng)參閱 OpenCV 文檔。
最后,對(duì)齊的臉面。
對(duì)齊人臉
開始編寫人臉對(duì)齊腳本,將其命名為Now let's put this alignment class to work with a simple driver script. Open up a new file, name it align_faces.py:
# import the necessary packages from imutils.face_utils import FaceAligner from imutils.face_utils import rect_to_bb import argparse import imutils import dlib import cv2 # construct the argument parser and parse the arguments ap = argparse.ArgumentParser() ap.add_argument("-p", "--shape-predictor", required=True, help="path to facial landmark predictor") ap.add_argument("-i", "--image", required=True, help="path to input image") args = vars(ap.parse_args())
如果您的系統(tǒng)上沒有安裝 imutils 和/或 dlib,請(qǐng)確保通過 pip 安裝/升級(jí)它們:
pip install --upgrade imutils pip install --upgrade dlib
win10安裝dlib參考:如何安裝dlib gpu版本
# initialize dlib's face detector (HOG-based) and then create # the facial landmark predictor and the face aligner detector = dlib.get_frontal_face_detector() predictor = dlib.shape_predictor(args["shape_predictor"]) fa = FaceAligner(predictor, desiredFaceWidth=256)
使用 dlib 的 get_frontal_face_detector 初始化我們的檢測(cè)器對(duì)象。
使用 --shape-predictor 來實(shí)例化我們的面部標(biāo)志預(yù)測(cè)器,這是 dlib 的預(yù)訓(xùn)練預(yù)測(cè)器的路徑。
通過在第 21 行初始化一個(gè)對(duì)象 fa 來利用剛剛在上一節(jié)中構(gòu)建的 FaceAligner 類。我們指定了 256 像素的人臉寬度。
接下來,加載圖像并為人臉檢測(cè)做準(zhǔn)備:
# load the input image, resize it, and convert it to grayscale image = cv2.imread(args["image"]) image = imutils.resize(image, width=800) gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # show the original input image and detect faces in the grayscale # image cv2.imshow("Input", image) rects = detector(gray, 2)
加載由命令行參數(shù) --image 指定的圖像。 調(diào)整圖像的大小,保持第 25 行的縱橫比,使其寬度為 800 像素。 然后將圖像轉(zhuǎn)換為灰度。
處理輸入圖像中的人臉檢測(cè),我們?cè)谄渲袘?yīng)用了 dlib 的人臉檢測(cè)器。 此函數(shù)返回 rects ,這是我們檢測(cè)器發(fā)現(xiàn)的人臉周圍的邊界框列表。
在下一個(gè)塊中,我們遍歷 rects ,對(duì)齊每個(gè)人臉,并顯示原始和對(duì)齊的圖像。
# loop over the face detections for rect in rects: # extract the ROI of the *original* face, then align the face # using facial landmarks (x, y, w, h) = rect_to_bb(rect) faceOrig = imutils.resize(image[y:y + h, x:x + w], width=256) faceAligned = fa.align(image, gray, rect) # display the output images cv2.imshow("Original", faceOrig) cv2.imshow("Aligned", faceAligned) cv2.waitKey(0)
開始循環(huán)。
對(duì)于 dlib 預(yù)測(cè)的每個(gè)邊界框 rect,我們將其轉(zhuǎn)換為格式 (x, y, w, h)。
隨后,將框的大小調(diào)整為 256 像素的寬度,保持縱橫比。將這個(gè)原始但調(diào)整大小的圖像存儲(chǔ)為 faceOrig 。
對(duì)齊圖像,指定圖像、灰度圖像和矩形。
最后,將原始和對(duì)應(yīng)的對(duì)齊人臉圖像顯示到各自窗口的屏幕上。
在顯示下一個(gè)原始/對(duì)齊圖像對(duì)之前,等待用戶在任一窗口處于焦點(diǎn)時(shí)按下一個(gè)鍵。
對(duì)所有檢測(cè)到的人臉重復(fù)上面的過程,然后腳本退出。
展示結(jié)果
輸入命令:
python align_faces.py --shape-predictor shape_predictor_68_face_landmarks.dat --image 11.jpg
到此這篇關(guān)于人臉檢測(cè)實(shí)戰(zhàn)終極之OpenCV+Python實(shí)現(xiàn)人臉對(duì)齊的文章就介紹到這了,更多相關(guān)Python OpenCV人臉對(duì)齊內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python基于Opencv實(shí)現(xiàn)人臉口罩檢測(cè)
- Python OpenCV利用筆記本攝像頭實(shí)現(xiàn)人臉檢測(cè)
- python opencv人臉檢測(cè)提取及保存方法
- python版opencv攝像頭人臉實(shí)時(shí)檢測(cè)方法
- Python3.6.0+opencv3.3.0人臉檢測(cè)示例
- Python+OpenCV人臉檢測(cè)原理及示例詳解
- python利用OpenCV2實(shí)現(xiàn)人臉檢測(cè)
- python結(jié)合opencv實(shí)現(xiàn)人臉檢測(cè)與跟蹤
- python中使用OpenCV進(jìn)行人臉檢測(cè)的例子
- 使用 Python 和 OpenCV 實(shí)現(xiàn)攝像頭人臉檢測(cè)并截圖功能
相關(guān)文章
Python基于pygame實(shí)現(xiàn)的font游戲字體(附源碼)
這篇文章主要介紹了Python基于pygame實(shí)現(xiàn)的font游戲字體,涉及Python響應(yīng)鍵盤按鍵動(dòng)態(tài)操作圖片元素的相關(guān)技巧,需要的朋友可以參考下2015-11-11Python Scrapy框架:通用爬蟲之CrawlSpider用法簡單示例
這篇文章主要介紹了Python Scrapy框架:通用爬蟲之CrawlSpider用法,結(jié)合實(shí)例形式分析了Scrapy框架中CrawlSpider的基本使用方法,需要的朋友可以參考下2020-04-04詳解一種用django_cache實(shí)現(xiàn)分布式鎖的方式
這篇文章主要介紹了詳解一種用django_cache實(shí)現(xiàn)分布式鎖的方式,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-09-09python+requests接口壓力測(cè)試500次,查看響應(yīng)時(shí)間的實(shí)例
這篇文章主要介紹了python+requests接口壓力測(cè)試500次,查看響應(yīng)時(shí)間的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-04-04Python實(shí)現(xiàn)的遠(yuǎn)程登錄windows系統(tǒng)功能示例
這篇文章主要介紹了Python實(shí)現(xiàn)的遠(yuǎn)程登錄windows系統(tǒng)功能,結(jié)合實(shí)例形式分析了Python基于wmi模塊的遠(yuǎn)程連接與進(jìn)程操作相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下2018-06-06pycharm中下載的包但是import還是無法使用/報(bào)紅的解決方法
用pycharm開發(fā)時(shí),在導(dǎo)入自己寫的python文件時(shí)出現(xiàn)模塊名爆紅的情況,下面這篇文章主要給大家介紹了關(guān)于pycharm中下載包但是import還是無法使用/報(bào)紅的解決方法,需要的朋友可以參考下2023-02-02python爬蟲 基于requests模塊發(fā)起ajax的get請(qǐng)求實(shí)現(xiàn)解析
這篇文章主要介紹了python爬蟲 基于requests模塊發(fā)起ajax的get請(qǐng)求實(shí)現(xiàn)解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-08-08django序列化時(shí)使用外鍵的真實(shí)值操作
這篇文章主要介紹了django序列化時(shí)使用外鍵的真實(shí)值操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-07-07