c/c++的opencv圖像金字塔縮放實(shí)現(xiàn)
圖像金字塔是計(jì)算機(jī)視覺中一種重要且基礎(chǔ)的多尺度表示方法。它通過對(duì)原始圖像進(jìn)行連續(xù)的下采樣(縮?。┗蛏喜蓸樱ǚ糯螅┎僮?,生成一系列不同分辨率的圖像。這些圖像按尺寸大小排列,形似金字塔,故此得名。圖像金字塔在諸如特征檢測(cè)、圖像分割、目標(biāo)識(shí)別和圖像融合等任務(wù)中扮演著關(guān)鍵角色。
本文將重點(diǎn)介紹如何使用 OpenCV C++ API 中的函數(shù)來實(shí)現(xiàn)圖像金字塔的基本縮放操作:下采樣和上采樣。
圖像金字塔簡(jiǎn)介
圖像金字塔通常包含兩種主要類型:
- 高斯金字塔 (Gaussian Pyramid):用于圖像的下采樣。在每一層,圖像首先經(jīng)過高斯模糊處理,然后去除偶數(shù)行和偶數(shù)列,從而將圖像尺寸減半。
- 拉普拉斯金字塔 (Laplacian Pyramid):用于圖像重建,可以從高斯金字塔中恢復(fù)圖像。它存儲(chǔ)了高斯金字塔中相鄰層之間的差異信息。
本文主要關(guān)注構(gòu)成高斯金字塔基礎(chǔ)的下采樣 (cv::pyrDown
) 和其逆操作的上采樣 (cv::pyrUp
)。
圖像下采樣 (cv::pyrDown)
cv::pyrDown
函數(shù)用于將輸入圖像的寬度和高度都縮小一半。
函數(shù)原型:
void cv::pyrDown(InputArray src, OutputArray dst, const Size& dstsize = Size(), int borderType = BORDER_DEFAULT);
src
: 輸入圖像。dst
: 輸出圖像,其尺寸將是輸入圖像的一半(除非指定了dstsize
)。dstsize
: 可選參數(shù),指定輸出圖像的尺寸。如果未指定(默認(rèn)),則輸出圖像尺寸計(jì)算為Size((src.cols+1)/2, (src.rows+1)/2)
。通常我們讓其自動(dòng)計(jì)算。borderType
: 像素外推方法,用于處理邊界(一般使用默認(rèn)值)。
工作原理:cv::pyrDown
的典型實(shí)現(xiàn)步驟如下:
- 對(duì)輸入圖像應(yīng)用高斯濾波器(通常是 5 × 5 5 \times 55×5 的核)。
- 對(duì)濾波后的圖像進(jìn)行下采樣,即刪除所有偶數(shù)行和偶數(shù)列。
圖像上采樣 (cv::pyrUp)
cv::pyrUp
函數(shù)用于將輸入圖像的寬度和高度都放大一倍。這個(gè)操作試圖從一個(gè)較低分辨率的圖像重建一個(gè)較高分辨率的圖像,但通常會(huì)伴隨一些模糊,因?yàn)樗鼰o法憑空創(chuàng)造細(xì)節(jié)。
函數(shù)原型:
void cv::pyrUp(InputArray src, OutputArray dst, const Size& dstsize = Size(), int borderType = BORDER_DEFAULT);
src
: 輸入圖像。dst
: 輸出圖像,其尺寸將是輸入圖像的兩倍(除非指定了dstsize
)。dstsize
: 可選參數(shù),指定輸出圖像的尺寸。如果未指定(默認(rèn)),則輸出圖像尺寸計(jì)算為Size(src.cols*2, src.rows*2)
。通常我們讓其自動(dòng)計(jì)算。borderType
: 像素外推方法(一般使用默認(rèn)值)。
工作原理:cv::pyrUp
的典型實(shí)現(xiàn)步驟如下:
- 將輸入圖像的尺寸擴(kuò)大兩倍,新增的行和列通常用0填充(或者其他插值方式)。
- 對(duì)擴(kuò)大后的圖像應(yīng)用高斯濾波器(與
pyrDown
中使用的核類似,但通常乘以4以保持亮度范圍)。這一步是為了平滑由于插入0值而產(chǎn)生的塊狀效應(yīng)。
C++ OpenCV 代碼示例
下面的 C++ 代碼演示了如何加載一張圖像,對(duì)其進(jìn)行下采樣,然后再對(duì)下采樣后的圖像進(jìn)行上采樣,并顯示結(jié)果。
#include <opencv2/imgproc.hpp> #include <opencv2/highgui.hpp> #include <iostream> int main(int argc, char** argv) { // 檢查命令行參數(shù) if (argc != 2) { std::cout << "用法: " << argv[0] << " <圖片路徑>" << std::endl; return -1; } // 1. 加載源圖像 cv::Mat srcImage = cv::imread(argv[1], cv::IMREAD_COLOR); if (srcImage.empty()) { std::cerr << "錯(cuò)誤: 無法加載圖像 " << argv[1] << std::endl; return -1; } std::cout << "原始圖像尺寸: " << srcImage.cols << "x" << srcImage.rows << std::endl; // 2. 圖像下采樣 (縮小一半) cv::Mat downsampledImage; cv::pyrDown(srcImage, downsampledImage); std::cout << "下采樣后圖像尺寸: " << downsampledImage.cols << "x" << downsampledImage.rows << std::endl; // 3. 圖像上采樣 (放大一倍,基于下采樣后的圖像) cv::Mat upsampledImage; cv::pyrUp(downsampledImage, upsampledImage); std::cout << "上采樣后圖像尺寸: " << upsampledImage.cols << "x" << upsampledImage.rows << std::endl; // 4. 為了比較,我們也可以對(duì)原始圖像直接進(jìn)行一次上采樣 cv::Mat upsampledOriginalImage; cv::pyrUp(srcImage, upsampledOriginalImage); std::cout << "原始圖像直接上采樣后尺寸: " << upsampledOriginalImage.cols << "x" << upsampledOriginalImage.rows << std::endl; // 5. 顯示圖像 cv::imshow("原始圖像", srcImage); cv::imshow("下采樣圖像 (pyrDown)", downsampledImage); cv::imshow("上采樣圖像 (pyrUp on downsampled)", upsampledImage); cv::imshow("原始圖像直接上采樣 (pyrUp on original)", upsampledOriginalImage); cv::waitKey(0); // 等待按鍵 cv::destroyAllWindows(); // 關(guān)閉所有窗口 return 0; }
代碼解釋
- 包含頭文件:
- opencv2/imgproc.hpp: 包含了圖像處理函數(shù),如 pyrDown 和 pyrUp。
- opencv2/highgui.hpp: 包含了圖像的顯示和加載函數(shù),如 imread, imshow, waitKey。
- iostream: 用于控制臺(tái)輸出。
- 加載圖像:使用 cv::imread() 從命令行參數(shù)指定的路徑加載圖像。
- cv::pyrDown(srcImage, downsampledImage);:對(duì)原始圖像 srcImage 進(jìn)行下采樣,結(jié)果存儲(chǔ)在 downsampledImage 中。輸出圖像的寬高大約是輸入圖像的一半。
- cv::pyrUp(downsampledImage, upsampledImage);:對(duì)之前下采樣得到的 downsampledImage 進(jìn)行上采樣,結(jié)果存儲(chǔ)在 upsampledImage 中。輸出圖像的寬高大約是輸入圖像的兩倍。注意,upsampledImage 的尺寸應(yīng)該與 srcImage 的尺寸大致相同(由于整數(shù)除法可能存在1個(gè)像素的差異),但其內(nèi)容會(huì)比原始圖像模糊,因?yàn)橄虏蓸舆^程丟失了信息。
- 顯示圖像:使用 cv::imshow() 分別顯示原始圖像、下采樣后的圖像以及上采樣后的圖像。cv::waitKey(0) 使程序暫停,直到用戶按下任意鍵。
編譯與運(yùn)行
要編譯以上 C++ 代碼,你需要安裝好 OpenCV,并有一個(gè) C++ 編譯器(如 g++)。
編譯命令示例 (Linux/macOS):
g++ image_pyramid.cpp -o image_pyramid_app `pkg-config --cflags --libs opencv4` -std=c++11
(如果你的 pkg-config
配置的是 opencv
而不是 opencv4
,請(qǐng)相應(yīng)修改。-std=c++11
或更高版本均可。)
運(yùn)行命令:
./image_pyramid_app <你的圖片路徑.jpg>
例如:
./image_pyramid_applena.png
應(yīng)用場(chǎng)景 ???
圖像金字塔在許多計(jì)算機(jī)視覺算法中都有廣泛應(yīng)用:
- 多尺度特征檢測(cè):如 SIFT、SURF 等算法會(huì)在圖像金字塔的不同層上檢測(cè)特征,以實(shí)現(xiàn)尺度不變性。
- 圖像融合:例如,將多張不同曝光的圖像融合成一張高動(dòng)態(tài)范圍 (HDR) 圖像。
- 目標(biāo)檢測(cè):在不同尺度上搜索目標(biāo),以適應(yīng)目標(biāo)大小的變化。
- 圖像分割:先在低分辨率圖像上進(jìn)行粗略分割,然后逐步優(yōu)化到高分辨率。
- 視頻壓縮和流媒體:根據(jù)帶寬和設(shè)備能力提供不同分辨率的視頻流。
總結(jié)
cv::pyrDown
和 cv::pyrUp
是 OpenCV 中實(shí)現(xiàn)圖像金字塔縮放的基礎(chǔ)操作。它們簡(jiǎn)單易用,且是許多高級(jí)圖像處理和計(jì)算機(jī)視覺算法的重要組成部分。通過理解和運(yùn)用這些函數(shù),開發(fā)者可以有效地處理和分析不同尺度下的圖像信息。
到此這篇關(guān)于c/c++的opencv圖像金字塔縮放實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)opencv圖像金字塔縮放內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C++獲取多瀏覽器上網(wǎng)歷史記錄示例代碼(支持獲取IE/Chrome/FireFox)
這篇文章主要介紹了C++獲取多瀏覽器上網(wǎng)歷史記錄示例代碼,支持獲取IE, Chrome,FireFox等瀏覽器2013-11-11Visual C++ 常用數(shù)據(jù)類型轉(zhuǎn)換方法詳解
本文純粹是總結(jié)一下有關(guān)類型轉(zhuǎn)換的貼子,需要的朋友可以參考下2017-06-06c++ qsort 與sort 對(duì)結(jié)構(gòu)體排序?qū)嵗a
這篇文章主要介紹了c++ qsort 與sort 對(duì)結(jié)構(gòu)體排序?qū)嵗a,幫助大家更好的理解和學(xué)習(xí)c++,感興趣的朋友可以了解下2020-11-11解析C++函數(shù)的默認(rèn)參數(shù)和占位參數(shù)及較之C語言的拓展
這篇文章主要介紹了C++中的默認(rèn)參數(shù)和占位參數(shù)及較之C語言的拓展,需要的朋友可以參考下2016-03-03C語言?深入理解動(dòng)態(tài)規(guī)劃之計(jì)數(shù)類DP
動(dòng)態(tài)規(guī)劃可謂是大名鼎鼎,筆試面試中的高頻考點(diǎn),也是重點(diǎn)難點(diǎn),動(dòng)態(tài)規(guī)劃類型題目靈活多變,難度系數(shù)也相對(duì)較高,往往我們做不好動(dòng)態(tài)規(guī)劃的題目就會(huì)與心儀的offer失之交臂,本篇文章我們就一起來研究一下動(dòng)態(tài)規(guī)劃的計(jì)數(shù)類DP2022-04-04