C++快速排序的分析與優(yōu)化詳解
相信學(xué)過數(shù)據(jù)結(jié)構(gòu)與算法的朋友對(duì)于快速排序應(yīng)該并不陌生,本文就以實(shí)例講述了C++快速排序的分析與優(yōu)化,對(duì)于C++算法的設(shè)計(jì)有很好的借鑒價(jià)值。具體分析如下:
一、快速排序的介紹
快速排序是一種排序算法,對(duì)包含n個(gè)數(shù)的輸入數(shù)組,最壞的情況運(yùn)行時(shí)間為Θ(n2)[Θ 讀作theta]。雖然這個(gè)最壞情況的運(yùn)行時(shí)間比較差,但快速排序通常是用于排序的最佳的實(shí)用選擇。這是因?yàn)槠淦骄闆r下的性能相當(dāng)好:期望的運(yùn)行時(shí)間為 Θ(nlgn),且Θ(nlgn)記號(hào)中隱含的常數(shù)因子很小。另外,它還能夠進(jìn)行就地排序,在虛擬內(nèi)存環(huán)境中也能很好的工作。
和歸并排序一樣,快速排序也是基于分治法(Divide and conquer):
分解:數(shù)組A[p..r]被劃分成兩個(gè)(可能為空)的子數(shù)組A[p..q-1]和A[q+1..r],使得A[p..q-1]中的每個(gè)元素都小于等于A[q],A[q+1..r]中的每個(gè)元素都大于等于A[q]。這樣元素A[q]就位于其最終位置上了。
解決:通過遞歸調(diào)用快速排序,對(duì)子數(shù)組A[p..q-1]和A[q+1..r]排序。
合并:因?yàn)閮蓚€(gè)子數(shù)組是就地排序,不需要合并,整個(gè)數(shù)組已有序。
偽代碼如下:
PARTITION(A, p, r) x = A[p] i = p for j=p+1 to r do if A[j] <= x then i = i+1 exchange(A[i],A[j]) exchange(A[p], A[i]) return i QUICKSORT(A, p, r) if p < r then q = PARTITION(A, p, r) QUICKSORT(A, p, q-1) QUICKSORT(A, q+1, r)
二、性能分析
1、最壞情況
快速排序的最壞情況發(fā)生在當(dāng)數(shù)組已經(jīng)有序或者逆序排好的情況下。這樣的話劃分過程產(chǎn)生的兩個(gè)區(qū)域中有一個(gè)沒有元素,另一個(gè)包含n-1個(gè)元素。此時(shí)算法的運(yùn)行時(shí)間可以遞歸地表示為:T(n) = T(n-1)+T(0)+Θ(n),遞歸式的解為T(n)=Θ(n^2)??梢钥闯觯焖倥判蛩惴ㄗ顗那闆r運(yùn)行時(shí)間并不比插入排序的更好。
2、最好情況
如果我們足夠幸運(yùn),在每次劃分操作中做到最平衡的劃分,即將數(shù)組劃分為n/2:n/2。此時(shí)得到的遞歸式為T(n) = 2T(n/2)+Θ(n),根據(jù)主定理的情況二可得T(n)=Θ(nlgn)。
3、平均情況
假設(shè)一:快排中的劃分點(diǎn)非常偏斜,比如每次都將數(shù)組劃分為1/10 : 9/10的兩個(gè)子區(qū)域,這種情況下運(yùn)行時(shí)間是多少呢?運(yùn)行時(shí)間遞歸式為T(n) = T(n/10)+T(9n/10)+Θ(n),使用遞歸樹解得T(n)=Θ(nlgn)??梢钥闯?,當(dāng)劃分點(diǎn)非常偏斜的時(shí)候,運(yùn)行時(shí)間仍然是Θ(nlgn)。
假設(shè)二:Partition所產(chǎn)生的劃分既有“好的”,也有“差的”,它們交替出現(xiàn)。這種平均情況下運(yùn)行時(shí)間又是多少呢?這時(shí)的遞歸式為(G表示Good,B表示Bad):
G(n) = 2B(n/2) + Θ(n)
B(n) = G(n-1) + Θ(n)
解:G(n) = 2(G(n/2-1) + Θ(n/2)) + Θ(n) = 2G(n/2-1) + Θ(n) = Θ(nlgn)
可以看出,當(dāng)好、差劃分交替出現(xiàn)時(shí),快排的運(yùn)行時(shí)間就如全是好的劃分一樣,仍然是Θ(nlgn) 。
三、快排的優(yōu)化
經(jīng)過上面的分析可以知道,在輸入有序或逆序時(shí)快速排序很慢,在其余情況則表現(xiàn)良好。如果輸入本身已被排序,那么就糟了。那么我們?nèi)绾未_保對(duì)于所有輸 入,它均能夠獲得較好的平均情況性能呢?前面的快速排序我們默認(rèn)使用數(shù)組中第一個(gè)元素作為主元。假設(shè)隨機(jī)選擇數(shù)組中的元素作為主元,則快排的運(yùn)行時(shí)間將不 依賴于輸入序列的順序。我們把隨機(jī)選擇主元的快速排序叫做Randomized Quicksort。
在隨機(jī)化的快速排序中,我們不是始終選擇第一個(gè)元素作為主元,而是從數(shù)組A[p…r]中隨機(jī)選擇一個(gè)元素,然后將其與第一個(gè)元素交換。由于主元元素是隨機(jī)選擇的,我們期望在平均情況下,對(duì)輸入數(shù)組的劃分能夠比較對(duì)稱。
偽代碼如下:
RANDOMIZED-PARTITION(A, p, r) i = RANDOM(p, r) exchange(A[p], A[i]) return PARTITION(A, p, r) RANDOMIZED-QUICKSORT(A, p, r) if p < r then q = RANDOMIZED-PARTITION(A, p, r) RANDOMIZED-QUICKSORT(A, p, q-1) RANDOMIZED-QUICKSORT(A, q+1, r)
我們對(duì)3萬個(gè)元素的有序序列分別進(jìn)行傳統(tǒng)的快速排序 和 隨機(jī)化的快速排序,并比較它們的運(yùn)行時(shí)間:
/************************************************************************* > File Name: QuickSort.cpp > Author: SongLee ************************************************************************/ #include<iostream> #include<cstdlib> // srand rand #include<ctime> // clock_t clock using namespace std; void swap(int &a, int &b) { int tmp = a; a = b; b = tmp; } // 傳統(tǒng)劃分操作 int Partition(int A[], int low, int high) { int pivot = A[low]; int i = low; for(int j=low+1; j<=high; ++j) { if(A[j] <= pivot) { ++i; swap(A[i], A[j]); } } swap(A[i], A[low]); return i; } // 隨機(jī)化劃分操作,隨機(jī)選擇pivot int Partition_Random(int A[], int low, int high) { srand(time(NULL)); int i = rand() % (high+1); swap(A[low], A[i]); return Partition(A, low, high); } // 傳統(tǒng)快排 void QuickSort(int A[], int low, int high) { if(low < high) { int pos = Partition(A, low, high); QuickSort(A, low, pos-1); QuickSort(A, pos+1, high); } } // 隨機(jī)化快速排序 void QuickSort_Random(int A[], int low, int high) { if(low < high) { int pos = Partition_Random(A, low, high); QuickSort_Random(A, low, pos-1); QuickSort_Random(A, pos+1, high); } } int main() { clock_t t1, t2; // 初始化數(shù)組 int A[30000]; for(int i=0; i<30000; ++i) A[i] = i+1; t1 = clock(); QuickSort(A, 0, 30000-1); t1 = clock() - t1; cout << "Traditional quicksort took "<< t1 << " clicks(about " << ((float)t1)/CLOCKS_PER_SEC << " seconds)." << endl; t2 = clock(); QuickSort_Random(A, 0, 30000-1); t2 = clock() - t2; cout << "Randomized quicksort took "<< t2 << " clicks(about " << ((float)t2)/CLOCKS_PER_SEC << " seconds)." << endl; return 0; }
運(yùn)行結(jié)果如下:
[songlee@localhost ~]$ ./QuickSort Traditional quicksort took 1210309 clicks(about 1.21031 seconds). Randomized quicksort took 457573 clicks(about 0.457573 seconds). [songlee@localhost ~]$ ./QuickSort Traditional quicksort took 1208038 clicks(about 1.20804 seconds). Randomized quicksort took 644950 clicks(about 0.64495 seconds).
從運(yùn)行結(jié)果可以看出,對(duì)于有序的輸入,隨機(jī)化版本的快速排序的效率會(huì)高很多。
問題記錄:
我們知道交換兩個(gè)變量的值有以下三種方法:
int tmp = a; // 方法一 a = b; b = tmp a = a+b; // 方法二 b = a-b; a = a-b; a = a^b; // 方法三 b = a^b; a = a^b;
但是你會(huì)發(fā)現(xiàn)在本程序中,如果swap函數(shù)使用后面兩種方法會(huì)出錯(cuò)。由于方法二和方法三沒有使用中間變量,它們交換值的原理是直接對(duì)變量的內(nèi)存單元進(jìn)行操作。如果兩個(gè)變量對(duì)應(yīng)的同一內(nèi)存單元,則經(jīng)過兩次加減或異或操作,內(nèi)存單元的值已經(jīng)變?yōu)榱?,因而不能實(shí)現(xiàn)變量值交換。所以當(dāng)需要交換值的變量可能是同一變量時(shí),必須使用第三變量實(shí)現(xiàn)交換,否則會(huì)對(duì)變量清零。
相關(guān)文章
C++中l(wèi)ist的使用與模擬實(shí)現(xiàn)
list相較于vector來說會(huì)顯得復(fù)雜,它的好處是在任意位置插入,刪除都是一個(gè)O(1)的時(shí)間復(fù)雜度,下面這篇文章主要給大家介紹了關(guān)于C++中l(wèi)ist的使用與模擬實(shí)現(xiàn)的相關(guān)資料,需要的朋友可以參考下2022-05-05利用C語言編輯畫圖程序的實(shí)現(xiàn)方法(推薦)
下面小編就為大家?guī)硪黄肅語言編輯畫圖程序的實(shí)現(xiàn)方法(推薦)。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-06-06C++設(shè)計(jì)模式之迭代器模式(Iterator)
這篇文章主要為大家詳細(xì)介紹了C++設(shè)計(jì)模式之迭代器模式Iterator,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-04-04C++?AVL樹的兩單旋和兩雙旋的項(xiàng)目實(shí)踐
本文主要介紹了C++?AVL樹的兩單旋和兩雙旋的項(xiàng)目實(shí)踐,根據(jù)節(jié)點(diǎn)插入位置的不同,AVL樹的旋轉(zhuǎn)分為四種,下面就來介紹一下,感興趣的可以了解一下2024-03-03關(guān)于C++友元類的實(shí)現(xiàn)講解
今天小編就為大家分享一篇關(guān)于關(guān)于C++友元類的實(shí)現(xiàn)講解,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧2018-12-12C++實(shí)現(xiàn)LeetCode(68.文本左右對(duì)齊)
這篇文章主要介紹了C++實(shí)現(xiàn)LeetCode(68.文本左右對(duì)齊),本篇文章通過簡(jiǎn)要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-07-07