yolov5模型配置yaml文件詳細(xì)講解
yolov5的代碼模型構(gòu)建是通過(guò).yaml文件實(shí)現(xiàn)的,初次看上去會(huì)一頭霧水,這里記錄一下,也方便自己后面用到的時(shí)候查看。
以models/yolov5s.yaml為例
文件內(nèi)容如下:
# Parameters nc: 5 # number of classes depth_multiple: 0.33 # model depth multiple width_multiple: 0.50 # layer channel multiple anchors: - [24,24,29,84,59,42] # P3/8 - [45,146,75,87,157,49] # P4/16 - [310,167,139,341,127,151] # P5/32 # YOLOv5 backbone backbone: # [from, number, module, args] [[-1, 1, Focus, [64, 3]], # 0-P1/2 [-1, 1, Conv, [128, 3, 2]], # 1-P2/4 [-1, 3, C3, [128]], [-1, 1, Conv, [256, 3, 2]], # 3-P3/8 [-1, 9, C3, [256]], [-1, 1, Conv, [512, 3, 2]], # 5-P4/16 [-1, 9, C3, [512]], [-1, 1, Conv, [1024, 3, 2]], # 7-P5/32 [-1, 1, SPP, [1024, [5, 9, 13]]], [-1, 3, C3, [1024, False]], # 9 ] # YOLOv5 head head: [[-1, 1, Conv, [512, 1, 1]], [-1, 1, nn.Upsample, [None, 2, 'nearest']], [[-1, 6], 1, Concat, [1]], # cat backbone P4 [-1, 3, C3, [512, False]], # 13 [-1, 1, Conv, [256, 1, 1]], [-1, 1, nn.Upsample, [None, 2, 'nearest']], [[-1, 4], 1, Concat, [1]], # cat backbone P3 [-1, 3, C3, [256, False]], # 17 (P3/8-small) [-1, 1, Conv, [256, 3, 2]], [[-1, 14], 1, Concat, [1]], # cat head P4 [-1, 3, C3, [512, False]], # 20 (P4/16-medium) [-1, 1, Conv, [512, 3, 2]], [[-1, 10], 1, Concat, [1]], # cat head P5 [-1, 3, C3, [1024, False]], # 23 (P5/32-large) [[17, 20, 23], 1, Detect, [nc, anchors]], # Detect(P3, P4, P5) ]
我們一個(gè)一個(gè)來(lái)解釋:
- 一些基本參數(shù):
- nc 數(shù)據(jù)集中物體的類別數(shù)
- depth_multiple 控制網(wǎng)絡(luò)深度的系數(shù)
- width_multiple 控制網(wǎng)絡(luò)寬度的系數(shù)
- anchors 給不同尺度特征圖分配的anchors,可以看到包含三個(gè)列表,表示給三個(gè)尺度分配,這三個(gè)尺度在[[17, 20, 23], 1, Detect, [nc, anchors]] 指明,分別是網(wǎng)絡(luò)的第17、20和23層。注釋P3/8是指輸入下采樣了23 = 8倍,我們也可以發(fā)現(xiàn)網(wǎng)絡(luò)的第17層特征圖為輸入的1/8。
- BackBone:
骨干網(wǎng)絡(luò)的定義,是一個(gè)列表,每一行表示一層??梢钥吹矫恳恍惺怯?個(gè)元素的列表,[from, number, module, args]說(shuō)明了這個(gè)4個(gè)元素的意思。- from 表示該層的輸入從哪來(lái)。-1表示輸入取自上一層,-2表示上兩層,3表示第3層(從0開始數(shù)),[-1, 4]表示取自上一層和第4層,依次類推。。。網(wǎng)絡(luò)層數(shù)的數(shù)法在注釋里已經(jīng)標(biāo)出來(lái)了,從0開始,每一行表示一層,例如0-P1/2表示第0層,特征圖尺寸為輸入的1/21。
- number 表示該層模塊堆疊的次數(shù),對(duì)于C3、BottleneckCSP等模塊,表示其子模塊的堆疊,具體細(xì)節(jié)可以查看源代碼。當(dāng)然最終的次數(shù)還要乘上depth_multiple系數(shù)。
- module 表示該層的模塊是啥。Conv就是卷積+BN+激活模塊。所有的模塊在 model/common.py 中都有定義。
- args 表示輸入到模塊的參數(shù)。例如Conv:[128, 3, 2] 表示輸出通道128,卷積核尺寸3,strid=2,當(dāng)然最終的輸出通道數(shù)還要乘上 width_multiple,對(duì)于其他模塊,第一個(gè)參數(shù)值一般都是指輸出通道數(shù),具體細(xì)節(jié)可以看 model/common.py 中的定義。
- Head
規(guī)則和BackBone一毛一樣,這里再解釋一些最后一層:
[[17, 20, 23], 1, Detect, [nc, anchors]] 表示把第17、20和23三層作為Detect模塊的輸入, [nc, anchors]是初始化Detect模塊的參數(shù)。Detect模塊在model/yolo.py中聲明,相當(dāng)于從模型中提出想要的層作為輸入,轉(zhuǎn)換為相應(yīng)的檢測(cè)頭,其輸出用來(lái)計(jì)算loss。
補(bǔ)充:模型 yaml 文件中第四參數(shù)解釋
這里是對(duì) backbone 和 head 超參數(shù)中第四個(gè)參數(shù)的理解
當(dāng)?shù)谌齻€(gè)參數(shù)為 Focus 時(shí),第四個(gè)參數(shù)中,第一個(gè)值為該模塊中需要用到的通道數(shù),第二個(gè)值為卷積核大?。?/p>
當(dāng)?shù)谌齻€(gè)參數(shù)為 Conv 時(shí),第四個(gè)參數(shù)中,第一個(gè)值為該模塊中需要用到的通道數(shù),第二個(gè)值為卷積核大小,第三個(gè)參數(shù)為步距大??;
當(dāng)?shù)谌齻€(gè)參數(shù)為 BottleneckCSP 時(shí),第四個(gè)參數(shù)中,第一個(gè)值是該模塊用到的通道數(shù);如果存在第二個(gè)參數(shù),第二個(gè)參數(shù):是否啟用 shortcut 連接
當(dāng)?shù)谌齻€(gè)參數(shù)為 SPP時(shí),第四個(gè)參數(shù)就是 SPP 中需要用到的卷積核大小。
當(dāng)?shù)谌齻€(gè)參數(shù)為 nn.Upsample時(shí),就是 torch 中實(shí)現(xiàn)的上采樣函數(shù)。
當(dāng)?shù)谌齻€(gè)參數(shù)為 Concat時(shí),第四個(gè)參數(shù)就是 concat 中拼接的維度。
當(dāng)?shù)谌齻€(gè)參數(shù)為 Detect時(shí),第四個(gè)參數(shù)中,第一個(gè)值為類別個(gè)數(shù),第二個(gè)值為超參數(shù) anchors 的值。
總結(jié)
到此這篇關(guān)于yolov5模型配置yaml文件詳細(xì)講解的文章就介紹到這了,更多相關(guān)yolov5模型配置yaml文件內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
pytorch 實(shí)現(xiàn)刪除tensor中的指定行列
今天小編就為大家分享一篇pytorch 實(shí)現(xiàn)刪除tensor中的指定行列,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-01-01基于Python實(shí)現(xiàn)拆分和合并GIF動(dòng)態(tài)圖
這篇文章主要介紹了Python拆分和合并GIF動(dòng)態(tài)圖,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-10-10python自動(dòng)化調(diào)用百度api解決驗(yàn)證碼
這篇文章主要介紹了python自動(dòng)化調(diào)用百度api解決驗(yàn)證碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04Python3爬蟲爬取百姓網(wǎng)列表并保存為json功能示例【基于request、lxml和json模塊】
這篇文章主要介紹了Python3爬蟲爬取百姓網(wǎng)列表并保存為json功能,涉及Python基于request、lxml和json模塊的Request請(qǐng)求與響應(yīng)數(shù)據(jù)處理相關(guān)操作技巧,需要的朋友可以參考下2018-12-12基于pytorch實(shí)現(xiàn)對(duì)圖片進(jìn)行數(shù)據(jù)增強(qiáng)
圖像數(shù)據(jù)增強(qiáng)是一種在訓(xùn)練機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型時(shí)常用的策略,尤其是在計(jì)算機(jī)視覺(jué)領(lǐng)域,具體而言,它通過(guò)創(chuàng)建和原始圖像稍有不同的新圖像來(lái)擴(kuò)大訓(xùn)練集,本文給大家介紹了如何基于pytorch實(shí)現(xiàn)對(duì)圖片進(jìn)行數(shù)據(jù)增強(qiáng),需要的朋友可以參考下2024-01-01