Python基于HOG+SVM/RF/DT等模型實現(xiàn)目標(biāo)人行檢測功能
當(dāng)下基本所有的目標(biāo)檢測類的任務(wù)都會選擇基于深度學(xué)習(xí)的方式,諸如:YOLO、SSD、RCNN等等,這一領(lǐng)域不乏有很多出色的模型,而且還在持續(xù)地推陳出新,模型的迭代速度很快,其實最早實現(xiàn)檢測的時候還是基于機器學(xué)習(xí)去做的,HOG+SVM就是非常經(jīng)典有效的一套框架,今天這里并不是說要做出怎樣的效果,而是基于HOG+SVM來實踐機器學(xué)習(xí)檢測的流程。
這里為了方便處理,我是從網(wǎng)上找的一個數(shù)據(jù)集,主要是行人檢測方向的,當(dāng)然了這個用車輛檢測、火焰檢測等等的數(shù)據(jù)集都是可以的,本質(zhì)都是一樣的。
首先看下數(shù)據(jù)集,數(shù)據(jù)集主要分為兩個類別,一個類別是包含行人的,另一個類別是不包含行人的,首先看下不包含行人的:
接下來看下包含行人的:
看到這里,其實就不難理解,這里的SVM扮演的主要作用就是二分類模型了。
接下來我們需要對原始圖像的數(shù)據(jù)集進行特征提取計算,這里是基于HOG的方式實現(xiàn)的,可以自行實現(xiàn)HOG特征向量提取方法,也可以直接使用skimage提供的HOG提取器來一步實現(xiàn),這里為了方便,我是直接使用的skimage提供的HOG方法,核心實現(xiàn)如下:
def img2Feature(dataDir="data/",save_path="feature.json"): """ 特征提取計算 """ feature=[] for one_label in os.listdir(dataDir): print("one_label: ", one_label) oneDir=dataDir+one_label+'/' for one_pic in os.listdir(oneDir): one_path=oneDir+one_pic print("one_path: ", one_path) #加載圖像 one_img = imread(one_path, as_gray=True) one_vec = hog(one_img, orientations=orientations, pixels_per_cell=pixels_per_cell, cells_per_block=cells_per_block, visualize=visualize, block_norm=normalize) one_vec=one_vec.tolist() one_vec.append(one_label) feature.append(one_vec) print("feature_length: ", len(feature)) with open(save_path,"w") as f: f.write(json.dumps(feature))
HOG提取得到的向量維度很大,這里就不進行展示了。
之后就可以訓(xùn)練模型了,核心實現(xiàn)如下:
resDir = "results/" if not os.path.exists(resDir): os.makedirs(resDir) data = "feature.json" dict1 = DTModel(data=data, rationum=0.25, model_path=resDir + "DT.model") dict2 = RFModel(data=data, rationum=0.25, model_path=resDir + "RF.model") dict3 = SVMModel(data=data, rationum=0.25, model_path=resDir + "SVM.model") res_dict = {} res_dict["DT"], res_dict["RF"], res_dict["SVM"] = dict1, dict2, dict3 with open(resDir + "res_dict.json", "w") as f: f.write(json.dumps(res_dict)) comparePloter(dict1, dict2, dict3, save_path=resDir + "comparePloter.jpg")
這里,我是同時使用了決策樹DT、隨機森林RF、支持向量機SVM三種模型來進行分類和對比可視化,對比結(jié)果如下:
{ "DT": { "precision": 0.7573482282561567, "recall": 0.7597846737437716, "F1": 0.7584933696379963, "accuracy": 0.7584933696379963 }, "RF": { "precision": 0.9156160607479066, "recall": 0.8801773928046967, "F1": 0.893107332148193, "accuracy": 0.893107332148193 }, "SVM": { "precision": 0.9281402443868877, "recall": 0.9272928963585789, "F1": 0.9277128372009962, "accuracy": 0.9277128372009962 } }
為了直觀展示,這里對三種模型的性能進行可視化展示,如下所示:
接下來我們對訓(xùn)練好的模型調(diào)用進行測試,查看具體的效果,隨機選取了幾張網(wǎng)上的圖像,測試結(jié)果如下:
整體看下來,效果表現(xiàn)一般,不過這個也只是主要以實踐流程為目的,并不是實際做項目的,而且各個環(huán)節(jié)都有優(yōu)化提升的空間,模型的參數(shù)也都沒有調(diào)過。
到此這篇關(guān)于Python基于HOG+SVM/RF/DT等模型實現(xiàn)目標(biāo)檢測[行人檢測]的文章就介紹到這了,更多相關(guān)Python目標(biāo)檢測內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python中Tkinter Scrollbar滾動條(窗口滑動條)
本文主要介紹了Python中Tkinter Scrollbar滾動條(窗口滑動條),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-03-03Python代碼顯得Pythonic(區(qū)別于其他語言的寫法)
這篇文章主要介紹了Python代碼顯得Pythonic(區(qū)別于其他語言的寫法),對于字符串連接,相比于簡單的+,更pythonic的做法是盡量使用%操作符或者format函數(shù)格式化字符串,感興趣的小伙伴和小編一起進入文章了解更詳細相關(guān)知識內(nèi)容吧2022-02-02Python NumPy實現(xiàn)數(shù)組排序與過濾示例分析講解
NumPy是Python的一種開源的數(shù)值計算擴展,它支持大量的維度數(shù)組與矩陣運算,這篇文章主要介紹了使用NumPy實現(xiàn)數(shù)組排序與過濾的方法,需要的朋友們下面隨著小編來一起學(xué)習(xí)吧2023-05-05win7上python2.7連接mysql數(shù)據(jù)庫的方法
這篇文章主要介紹了win7上python2.7連接mysql數(shù)據(jù)庫的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-01-01Python 實現(xiàn)繪制子圖及子圖刻度的變換等問題
這篇文章主要介紹了Python 實現(xiàn)繪制子圖及子圖刻度的變換等問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-05-05