快捷導(dǎo)航

堆排序原理及算法代碼詳解

更新時間：2021年08月11日 14:46:49 作者：抽離的心

這篇文章主要介紹了堆排序算法的講解及Java版實現(xiàn),堆排序基于堆這種數(shù)據(jù)結(jié)構(gòu),在本文中對堆的概念也有補(bǔ)充介紹,需要的朋友可以參考下

一、堆排序算法原理和動態(tài)圖解

將待排序的序列構(gòu)造成一個大頂堆。此時，整個序列的最大值就是堆頂?shù)母?jié)點。將它移走(其實就是將其與堆數(shù)組的末尾元素交換，此時末尾元素就是最大值)，然后將剩余的n-1個序列重新構(gòu)造成一個堆，這樣就會得到n個元素中的次最大值。如此反復(fù)執(zhí)行，就能得到一個有序序列了。這個過程其實就是先構(gòu)建一個最大/最小二叉堆，然后不停的取出最大/最小元素（頭結(jié)點），插入到新的隊列中，以此達(dá)到排序的目的。如下圖所示：

二、二叉樹定義

要了解堆首先得了解一下二叉樹，在計算機(jī)科學(xué)中，二叉樹是每個節(jié)點最多有兩個子樹的樹結(jié)構(gòu)。通常子樹被稱作“左子樹”(left subtree)和“右子樹”(right subtree)。二叉樹常被用于實現(xiàn)二叉查找樹和二叉堆。二叉樹的每個結(jié)點至多只有二棵子樹（不存在度大于 2 的結(jié)點），二叉樹的子樹有左右之分，次序不能顛倒。二叉樹的第 i 層至多有 2i - 1 個結(jié)點；深度為 k 的二叉樹至多有 2k - 1 個結(jié)點；對任何一棵二叉樹 T，如果其終端結(jié)點數(shù)為 n0，度為 2 的結(jié)點數(shù)為 n2，則n0 = n2 + 1。二叉樹又分為完全二叉樹（complete binary tree）和滿二叉樹（full binary tree）。樹和二叉樹的三個主要差別：

樹的結(jié)點個數(shù)至少為 1，而二叉樹的結(jié)點個數(shù)可以為 0
樹中結(jié)點的最大度數(shù)沒有限制，而二叉樹結(jié)點的最大度數(shù)為 2
樹的結(jié)點無左、右之分，而二叉樹的結(jié)點有左、右之分

1.滿二叉樹：一棵深度為 k，且有 2k - 1 個節(jié)點稱之為滿二叉樹，即每一層上的節(jié)點數(shù)都是最大節(jié)點數(shù)。如下圖b所示：深度為3的滿二叉樹。

2.完全二叉樹：而在一棵二叉樹中，除最后一層外，若其余層都是滿的，并且最后一層或者是滿的，或者是在右邊缺少連續(xù)若干節(jié)點，則此二叉樹為完全二叉樹（Complete Binary Tree）。如下圖a所示：是一個深度為4的完全二叉樹。

三、堆的定義

堆（二叉堆）可以視為一棵完全的二叉樹，完全二叉樹的一個“優(yōu)秀”的性質(zhì)是，除了最底層之外，每一層都是滿的，這使得堆可以利用數(shù)組來表示（普通的一般的二叉樹通常用鏈表作為基本容器表示），每一個結(jié)點對應(yīng)數(shù)組中的一個元素。

對于7在數(shù)組存放的position=2，而它的子元素6的position=5=2*2[也就是父元素存放的位置]+1、子元素4的position=6=2*2[也就是父元素存放的位置]+2;同樣對于11在在數(shù)組存放的position=0，而它的子元素10的position=1=2*0[也就是父元素存放的位置]+1、子元素7的position=2=2*0[也就是父元素存放的位置]+2;所以對于i個元素，它的左右子節(jié)點在下標(biāo)以0開始的數(shù)組中的位置分別為：2*i+1、2*i+2。那腦補(bǔ)一下，對于不完全二叉樹，如果用數(shù)組來存放會有什么問題呢？當(dāng)然是中間有很多空的元素啦，所以說對于不完全二叉樹最好是用鏈表來存儲~。

堆的構(gòu)建過程示例：建堆的核心內(nèi)容是調(diào)整堆，使二叉樹滿足堆的定義（每個節(jié)點的值都不大于其父節(jié)點的值）。調(diào)堆的過程應(yīng)該從最后一個非葉子節(jié)點開始，假設(shè)有數(shù)組A = {1, 3, 4, 5, 7, 2, 6, 8, 0}。那么調(diào)堆的過程如下圖，數(shù)組下標(biāo)從0開始，A[3] = 5開始。分別與左孩子和右孩子比較大小，如果A[3]最大，則不用調(diào)整，否則和孩子中的值最大的一個交換位置，在圖1中是A[7] > A[3] > A[8]，所以A[3]與A[7]對換，從圖1.1轉(zhuǎn)到圖1.2。

二叉堆（英語：binary heap）是一種特殊的堆，二叉堆是完全二叉樹或者是近似完全二叉樹。二叉堆滿足堆特性：父節(jié)點的鍵值總是保持固定的序關(guān)系于任何一個子節(jié)點的鍵值，且每個節(jié)點的左子樹和右子樹都是一個二叉堆。當(dāng)父節(jié)點的鍵值總是大于或等于任何一個子節(jié)點的鍵值時為最大堆。當(dāng)父節(jié)點的鍵值總是小于或等于任何一個子節(jié)點的鍵值時為最小堆。二叉堆一般用數(shù)組來表示。如果根節(jié)點在數(shù)組中的位置是1，第n個位置的子節(jié)點分別在2n和 2n+1。因此，第1個位置的子節(jié)點在2和3，第2個位置的子節(jié)點在4和5。以此類推。這種基于1的數(shù)組存儲方式便于尋找父節(jié)點和子節(jié)點。如果存儲數(shù)組的下標(biāo)基于0，那么下標(biāo)為i的節(jié)點的子節(jié)點是2i + 1與2i + 2；其父節(jié)點的下標(biāo)是⌊floor((i − 1) ∕ 2)⌋。函數(shù)floor(x)的功能是“向下取整”，或者說“向下舍入”，即取不大于x的最大整數(shù)（與“四舍五入”不同，向下取整是直接取按照數(shù)軸上最接近要求值的左邊值，即不大于要求值的最大的那個值）。比如floor(1.1)、floor(1.9)都返回1。對于堆定義中的堆結(jié)構(gòu)插入元素：對于二叉堆來說，要插入一個新元素其整個過程是怎么樣的呢？這里還是以我們之前的那個二叉堆進(jìn)行說明，以插入"9"為例：

目前肯定不滿足二叉堆的要求，父接點6是小于新插入的節(jié)點9的，所以兩者進(jìn)行位置交換：

同樣的思路，父節(jié)點7比子節(jié)點9要小，所以需要調(diào)換位置:

至此元素插入完成，也符合二叉堆父元素大于子元素的規(guī)則，從添加過程中可以發(fā)現(xiàn)：只需更改待比較的元素，其它的任何元素位置不需要動，所以效率還是很高的。對于堆定義中的堆結(jié)構(gòu)刪除元素：這里以刪除根結(jié)點為例【因為刪除根節(jié)點是最重要的，所以以它為例】，整個過程如下：

這時當(dāng)然是不符合二叉堆的規(guī)則，接著這樣來做：

同理繼續(xù)進(jìn)行處理：

繼續(xù)：

經(jīng)過這些動作之后就將一個根結(jié)點給刪除掉了，可以發(fā)現(xiàn)其實跟插入一個元素一樣，只需更改待比較的元素，其它的任何元素位置不需要動，那像這種每次移除掉最大的值有啥用呢？堆排序就產(chǎn)生了，因為每次從根節(jié)點拿肯定是最大的數(shù)【以最大堆來說】，這樣拿出來的數(shù)就成了一個有序的數(shù)列了。注意：對于一個很大的堆，這種存儲是低效的。因為節(jié)點的子節(jié)點很可能在另外一個內(nèi)存頁中。B-heap是一種效率更高的存儲方式，把每個子樹放到同一內(nèi)存頁。如果用指針鏈表存儲堆，那么需要能訪問葉節(jié)點的方法?？梢詫Χ鏄洹按┚€”(threading)方式，來依序遍歷這些節(jié)點。

四、堆排序Java代碼實現(xiàn)

package com.luna.sort;
public class HeapSortMaxAndMin{
	public static void main(String[] args) {
		int[] array = { 19, 38, 7, 36, 5, 5, 3, 2, 1, 0, 56 };
		System.out.println("排序前:");
		for (int i = 0; i < array.length; i++) {
			System.out.print(array[i] + ",");
		}
		System.out.println();
		System.out.println("分割線---------------");
		heapSort(array);
		System.out.println("排序后:");
		for (int i = 0; i < array.length; i++) {
			System.out.print(array[i] + ",");
		}
	}
	public static void heapSort(int[] array) {
		if (array == null || array.length == 1)
			return;
		buildArrayToHeap(array); //將數(shù)組元素轉(zhuǎn)化為大頂堆/小頂堆
		for (int i = array.length - 1; i >= 1; i--) {
			// 經(jīng)過上面的一些列操作，目前array[0]是當(dāng)前數(shù)組里最大的元素，需要和末尾的元素交換，然后拿出最大的元素
			swap(array, 0, i);
			/**
			 * 交換完后，下次遍歷的時候，就應(yīng)該跳過最后一個元素，也就是最大的那個
			 * 值，然后開始重新構(gòu)建最大堆堆的大小就減去1，然后從0的位置開始最大堆
			 */
//			buildMaxHeap(array, i, 0);
			buildMinHeap(array, i, 0);
		}
	}
	// 構(gòu)建堆
	public static void buildArrayToHeap(int[] array) {
		if (array == null || array.length == 1)
			return;
		//遞推公式就是 int root = 2*i, int left = 2*i+1, int right = 2*i+2;
		int cursor = array.length / 2;
		for (int i = cursor; i >= 0; i--) { // 這樣for循環(huán)下，就可以第一次排序完成
//			buildMaxHeap(array, array.length, i);
			buildMinHeap(array, array.length, i);
		}
	}
	//大頂堆
	public static void buildMaxHeap(int[] array, int heapSieze, int index) {
		int left = index * 2 + 1; // 左子節(jié)點
		int right = index * 2 + 2; // 右子節(jié)點
		int maxValue = index; // 暫時定在Index的位置就是最大值
		// 如果左子節(jié)點的值，比當(dāng)前最大的值大，就把最大值的位置換成左子節(jié)點的位置
		if (left < heapSieze && array[left] > array[maxValue]) {
			maxValue = left;
		}
		// 如果右子節(jié)點的值，比當(dāng)前最大的值大，就把最大值的位置換成右子節(jié)點的位置
		if (right < heapSieze && array[right] > array[maxValue]) {
			maxValue = right;
		}
		// 如果不相等說明，這個子節(jié)點的值有比自己大的，位置發(fā)生了交換了位置
		if (maxValue != index) {
			swap(array, index, maxValue); // 就要交換位置元素
			// 交換完位置后還需要判斷子節(jié)點是否打破了最大堆的性質(zhì)。最大堆性質(zhì)：兩個子節(jié)點都比父節(jié)點小。
			buildMaxHeap(array, heapSieze, maxValue);
		}
	}
	//小頂堆
	public static void buildMinHeap(int[] array, int heapSieze, int index) {
		int left = index * 2 + 1; // 左子節(jié)點
		int right = index * 2 + 2; // 右子節(jié)點
		int maxValue = index; // 暫時定在Index的位置就是最小值
		// 如果左子節(jié)點的值，比當(dāng)前最小的值小，就把最小值的位置換成左子節(jié)點的位置
		if (left < heapSieze && array[left] < array[maxValue]) {
			maxValue = left;
		}
		// 如果右子節(jié)點的值，比當(dāng)前最小的值小，就把最小值的位置換成左子節(jié)點的位置
		if (right < heapSieze && array[right] < array[maxValue]) {
			maxValue = right;
		}
		// 如果不相等說明這個子節(jié)點的值有比自己小的，位置發(fā)生了交換了位置
		if (maxValue != index) {
			swap(array, index, maxValue); // 就要交換位置元素
			// 交換完位置后還需要判斷子節(jié)點是否打破了最小堆的性質(zhì)。最小性質(zhì)：兩個子節(jié)點都比父節(jié)點大。
			buildMinHeap(array, heapSieze, maxValue);
		}
	}
	// 數(shù)組元素交換
	public static void swap(int[] a, int i, int j) {
		int temp = a[i];
		a[i] = a[j];
		a[j] = temp;
	}
}

大頂堆優(yōu)化實現(xiàn)算法：

import java.util.Arrays;
public class MaxHeapSort {
    private int[] arr;
    public MaxHeapSort(int[] arr){
        this.arr = arr;
    }
    /**
     * 堆排序的主要入口方法，共兩步。
     */
    public void sort(){
        /*
         *  第一步：將數(shù)組堆化
         *  beginIndex = 第一個非葉子節(jié)點。
         *  從第一個非葉子節(jié)點開始即可。無需從最后一個葉子節(jié)點開始。
         *  葉子節(jié)點可以看作已符合堆要求的節(jié)點，根節(jié)點就是它自己且自己以下值為最大。
         */
        int len = arr.length - 1;
        int beginIndex = (len - 1) >> 1; 
        for(int i = beginIndex; i >= 0; i--){
            maxHeapify(i, len);
        }
        /*
         * 第二步：對堆化數(shù)據(jù)排序
         * 每次都是移出最頂層的根節(jié)點A[0]，與最尾部節(jié)點位置調(diào)換，同時遍歷長度 - 1。
         * 然后從新整理被換到根節(jié)點的末尾元素，使其符合堆的特性。
         * 直至未排序的堆長度為 0。
         */
        for(int i = len; i > 0; i--){
            swap(0, i);
            maxHeapify(0, i - 1);
        }
    }
    private void swap(int i,int j){
        int temp = arr[i];
        arr[i] = arr[j];
        arr[j] = temp;
    }
    /**
     * 調(diào)整索引為 index 處的數(shù)據(jù)，使其符合堆的特性。
     * @param index 需要堆化處理的數(shù)據(jù)的索引
     * @param len 未排序的堆（數(shù)組）的長度
     */
    private void maxHeapify(int index,int len){
        int li = (index << 1) + 1; // 左子節(jié)點索引
        int ri = li + 1;           // 右子節(jié)點索引
        int cMax = li;             // 子節(jié)點值最大索引，默認(rèn)左子節(jié)點。
        if(li > len) return;       // 左子節(jié)點索引超出計算范圍，直接返回。
        if(ri <= len && arr[ri] > arr[li]) // 先判斷左右子節(jié)點，哪個較大。
            cMax = ri;
        if(arr[cMax] > arr[index]){
            swap(cMax, index);      // 如果父節(jié)點被子節(jié)點調(diào)換，
            maxHeapify(cMax, len);  // 則需要繼續(xù)判斷換下后的父節(jié)點是否符合堆的特性。
        }
    }
    /**
     * 測試用例
     * 輸出：
     * [0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 8, 9, 9, 9]
     */
    public static void main(String[] args) {
        int[] arr = new int[]{3,5,3,0,8,6,1,5,8,6,2,4,9,4,7,0,1,8,9,7,3,1,2,5,9,7,4,0,2,6};        
        new MaxHeapSort(arr).sort();        
        System.out.println(Arrays.toString(arr));
    }
}