利用python實(shí)現(xiàn)AR教程
先了解如何利用python語言實(shí)現(xiàn)以平面和標(biāo)記物進(jìn)行姿態(tài)估計(jì)
本實(shí)驗(yàn)只是先實(shí)現(xiàn)一個(gè)簡單的小例子。簡單來說就是先識別出圖像中的參考面,再拍攝一張目標(biāo)圖像,將參考面頂部的3D模型投影到目標(biāo)圖像上。
大致步驟如下:
識別參考平面
在這一步中,我們所需要做的事就是提取參考圖像和目標(biāo)圖像的sift特征,然后使用RANSAC算法穩(wěn)健地估計(jì)單應(yīng)性矩陣。
代碼如下:
#計(jì)算特征 sift.process_image('D:輸入圖片/book_frontal.JPG', 'im0.sift') l0, d0 = sift.read_features_from_file('im0.sift') sift.process_image('D:輸入圖片/book_per.JPG', 'im1.sift') l1, d1 = sift.read_features_from_file('im1.sift') #匹配特征,并計(jì)算單應(yīng)性矩陣 matches = sift.match_twosided(d0, d1) ndx = matches.nonzero()[0] fp = homography.make_homog(l0[ndx, :2].T) ndx2 = [int(matches[i]) for i in ndx] tp = homography.make_homog(l1[ndx2, :2].T) model = homography.RansacModel() H, inliers = homography.H_from_ransac(fp, tp, model)
由上面代碼可得到單應(yīng)性矩陣,它能夠?qū)⒁环鶊D像中標(biāo)記物的點(diǎn)映射到另一幅圖像中的對應(yīng)點(diǎn)。還需要建立X-Y(Z=0)三維坐標(biāo)系,標(biāo)記物在Z=0平面上,原點(diǎn)在標(biāo)記物的某個(gè)位置上。
從單應(yīng)性推導(dǎo)出從參考面坐標(biāo)系到目標(biāo)圖像坐標(biāo)系的轉(zhuǎn)換
在進(jìn)行坐標(biāo)轉(zhuǎn)換之前,為了檢驗(yàn)單應(yīng)性矩陣結(jié)果的正確性,需要將一些三維物體放置在目標(biāo)圖像上,本實(shí)驗(yàn)使用了一個(gè)立方體。產(chǎn)生立方體的代碼如下:
def cube_points(c, wid): p = [] p.append([c[0]-wid, c[1]-wid, c[2]-wid]) p.append([c[0]-wid, c[1]+wid, c[2]-wid]) p.append([c[0]+wid, c[1]+wid, c[2]-wid]) p.append([c[0]+wid, c[1]-wid, c[2]-wid]) p.append([c[0]-wid, c[1]-wid, c[2]-wid]) p.append([c[0]-wid, c[1]-wid, c[2]+wid]) p.append([c[0]-wid, c[1]+wid, c[2]+wid]) p.append([c[0]+wid, c[1]+wid, c[2]+wid]) p.append([c[0]+wid, c[1]-wid, c[2]+wid]) p.append([c[0]-wid, c[1]-wid, c[2]+wid]) p.append([c[0]-wid, c[1]-wid, c[2]+wid]) p.append([c[0]-wid, c[1]+wid, c[2]+wid]) p.append([c[0]-wid, c[1]+wid, c[2]-wid]) p.append([c[0]+wid, c[1]+wid, c[2]-wid]) p.append([c[0]+wid, c[1]+wid, c[2]+wid]) p.append([c[0]+wid, c[1]-wid, c[2]+wid]) p.append([c[0]+wid, c[1]-wid, c[2]-wid] return array(p).T
先計(jì)算出照相機(jī)的標(biāo)定矩陣,就可以得出兩個(gè)視圖間的相對變換
代碼如下:
#計(jì)算照相機(jī)標(biāo)定矩陣,使用圖像的分辨率為747*1000 K = my_calibration((747, 1000)) #位于邊長為0.2,Z=0平面上的三維點(diǎn) box = cube_points([0, 0, 0.1], 0.1) #投影第一幅圖像上底部的正方形 cam1 = camera.Camera(hstack((K, dot(K, array([[0], [0], [-1]]))))) #底部正方形上的點(diǎn) box_cam1 = cam1.project(homography.make_homog(box[:, :5])) #使用H將點(diǎn)變換到第二幅圖像上 box_trans = homography.normalize(dot(H,box_cam1)) #從cam1和H中計(jì)算第二個(gè)照相機(jī)矩陣 cam2 = camera.Camera(dot(H, cam1.P)) A = dot(linalg.inv(K), cam2.P[:, :3]) A = array([A[:, 0], A[:, 1], cross(A[:, 0], A[:, 1])]).T cam2.P[:, :3] = dot(K, A) #使用第二個(gè)照相機(jī)矩陣投影 box_cam2 = cam2.project(homography.make_homog(box))
在圖像(像素空間)中投影我們的3D模型并繪制它。
#底部正方形的二維投影 figure() imshow(im0) plot(box_cam1[0, :], box_cam1[1, :], linewidth=3) title('2D projection of bottom square') axis('off') #使用H對二維投影進(jìn)行變換 figure() imshow(im1) plot(box_trans[0, :], box_trans[1, :], linewidth=3) title('2D projection transfered with H') axis('off') #三維立方體 figure() imshow(im1) plot(box_cam2[0, :], box_cam2[1, :], linewidth=3) title('3D points projected in second image') axis('off')
實(shí)驗(yàn)結(jié)果如下
什么是AR
AR全稱Augmented Reality,意為增強(qiáng)現(xiàn)實(shí)技術(shù)。
它是一種將真實(shí)世界信息和虛擬世界信息“無縫”集成的新技術(shù),是把原本在現(xiàn)實(shí)世界的一定時(shí)間空間范圍內(nèi)很難體驗(yàn)到的實(shí)體信息(視覺信息,聲音,味道,觸覺等),通過電腦等科學(xué)技術(shù),模擬仿真后再疊加,將虛擬的信息應(yīng)用到真實(shí)世界,被人類感官所感知,從而達(dá)到超越現(xiàn)實(shí)的感官體驗(yàn)。真實(shí)的環(huán)境和虛擬的物體實(shí)時(shí)地疊加到了同一個(gè)畫面或空間同時(shí)存在。
增強(qiáng)現(xiàn)實(shí)技術(shù),不僅展現(xiàn)了真實(shí)世界的信息,而且將虛擬的信息同時(shí)顯示出來,兩種信息相互補(bǔ)充、疊加。在視覺化的增強(qiáng)現(xiàn)實(shí)中,用戶利用頭盔顯示器,把真實(shí)世界與電腦圖形多重合成在一起,便可以看到真實(shí)的世界圍繞著它。
增強(qiáng)現(xiàn)實(shí)技術(shù)包含了多媒體、三維建模、實(shí)時(shí)視頻顯示及控制、多傳感器融合、實(shí)時(shí)跟蹤及注冊、場景融合等新技術(shù)與新手段。增強(qiáng)現(xiàn)實(shí)提供了在一般情況下,不同于人類可以感知的信息。
如何利用python實(shí)現(xiàn)AR
步驟和實(shí)現(xiàn)姿態(tài)估計(jì)無太大差別。由上述內(nèi)容計(jì)算出照相機(jī)的位置和姿態(tài),使用這些信息來放置計(jì)算機(jī)圖像學(xué)模型。這里我們放置了一個(gè)紅色的小茶壺。
在運(yùn)行代碼之前,我們需要先安裝PyGame和PyOpenGL,下載鏈接(https://www.lfd.uci.edu/~gohlke/pythonlibs/)。
核心代碼如下:
def set_projection_from_camera(K): #從照相機(jī)標(biāo)定矩陣中獲得視圖 glMatrixMode(GL_PROJECTION) glLoadIdentity() fx = K[0,0] fy = K[1,1] fovy = 2*math.atan(0.5*height/fy)*180/math.pi aspect = (width*fy)/(height*fx) near = 0.1 far = 100.0 gluPerspective(fovy,aspect,near,far) glViewport(0,0,width,height) def set_modelview_from_camera(Rt): #從照相機(jī)姿態(tài)中獲取模擬視圖矩陣 glMatrixMode(GL_MODELVIEW) glLoadIdentity() Rx = np.array([[1,0,0],[0,0,-1],[0,1,0]]) R = Rt[:,:3] U,S,V = np.linalg.svd(R) R = np.dot(U,V) R[0,:] = -R[0,:] t = Rt[:,3] M = np.eye(4) M[:3,:3] = np.dot(R,Rx) M[:3,3] = t M = M.T m = M.flatten() glLoadMatrixf(m) def draw_background(imname): #使用四邊形繪制背景圖像 bg_image = pygame.image.load(imname).convert() bg_data = pygame.image.tostring(bg_image,"RGBX",1) glMatrixMode(GL_MODELVIEW) glLoadIdentity() glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT) glEnable(GL_TEXTURE_2D) glBindTexture(GL_TEXTURE_2D,glGenTextures(1)) glTexImage2D(GL_TEXTURE_2D,0,GL_RGBA,width,height,0,GL_RGBA,GL_UNSIGNED_BYTE,bg_data) glTexParameterf(GL_TEXTURE_2D,GL_TEXTURE_MAG_FILTER,GL_NEAREST) glTexParameterf(GL_TEXTURE_2D,GL_TEXTURE_MIN_FILTER,GL_NEAREST) glBegin(GL_QUADS) glTexCoord2f(0.0,0.0); glVertex3f(-1.0,-1.0,-1.0) glTexCoord2f(1.0,0.0); glVertex3f( 1.0,-1.0,-1.0) glTexCoord2f(1.0,1.0); glVertex3f( 1.0, 1.0,-1.0) glTexCoord2f(0.0,1.0); glVertex3f(-1.0, 1.0,-1.0) glEnd() glDeleteTextures(1) def draw_teapot(size): #在原點(diǎn)處繪制紅色茶壺 glEnable(GL_LIGHTING) glEnable(GL_LIGHT0) glEnable(GL_DEPTH_TEST) glClear(GL_DEPTH_BUFFER_BIT) glMaterialfv(GL_FRONT,GL_AMBIENT,[0,0,0,0]) glMaterialfv(GL_FRONT,GL_DIFFUSE,[0.5,0.0,0.0,0.0]) glMaterialfv(GL_FRONT,GL_SPECULAR,[0.7,0.6,0.6,0.0]) glMaterialf(GL_FRONT,GL_SHININESS,0.25*128.0) glutSolidTeapot(size) width,height = 1000,747 def setup(): pygame.init() pygame.display.set_mode((width,height),OPENGL | DOUBLEBUF) pygame.display.set_caption("OpenGL AR demo")
實(shí)驗(yàn)結(jié)果如圖:
運(yùn)行代碼遇到的錯(cuò)誤及解決方案
錯(cuò)誤如下:An error ocurred while starting the kernelfreeglut ERROR: Function called without first calling ‘glutInit'.
原因:經(jīng)大神指點(diǎn)得知這個(gè)錯(cuò)誤是freeglut和glut共存的緣故,它們倆定義了相同的方法,這個(gè)是動(dòng)態(tài)鏈接庫的重疊問題,我的在ana\Lib\site-packages\OpenGL\DLLS文件夾里面。
你需要?jiǎng)h除freeglut.vc15.dll這個(gè)文件。我這是已經(jīng)刪除完的樣子。
以上這篇利用python實(shí)現(xiàn)AR教程就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python實(shí)現(xiàn) 獲取b站主播直播間 粉絲牌信息的方法
這篇文章主要介紹了python實(shí)現(xiàn) 獲取b站主播直播間粉絲牌信息 ,用于實(shí)現(xiàn)通過牌子逆向查主播信息這個(gè)功能,本文結(jié)合實(shí)例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下2023-02-02python使用Apriori算法進(jìn)行關(guān)聯(lián)性解析
這篇文章主要為大家分享了python使用Apriori算法進(jìn)行關(guān)聯(lián)性的解析,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-12-12python通過函數(shù)名調(diào)用函數(shù)的幾種方法總結(jié)
今天帶大家學(xué)習(xí)的是怎么使用python通過函數(shù)名調(diào)用函數(shù),文中對python通過函數(shù)名調(diào)用函數(shù)的幾種方法有非常詳細(xì)的介紹,需要的朋友可以參考下2021-06-06python使用celery實(shí)現(xiàn)訂單超時(shí)取消
這篇文章主要為大家詳細(xì)介紹了python使用celery實(shí)現(xiàn)訂單超時(shí)取消,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-03-03Python Pytorch深度學(xué)習(xí)之圖像分類器
今天小編就為大家分享一篇關(guān)于Pytorch圖像分類器的文章,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-10-10python實(shí)現(xiàn)DES加密解密方法實(shí)例詳解
這篇文章主要介紹了python實(shí)現(xiàn)DES加密解密方法,以實(shí)例形式較為詳細(xì)的分析了基于Python實(shí)現(xiàn)的DES加密與解密技巧,需要的朋友可以參考下2015-06-06python 將numpy維度不同的數(shù)組相加相乘操作
這篇文章主要介紹了python 將numpy維度不同的數(shù)組相加相乘操作,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03