快捷導航

python實現(xiàn)堆和索引堆的代碼示例

更新時間：2018年03月19日 14:39:23 作者：黃天浩

本篇文章主要介紹了python實現(xiàn)堆和索引堆的代碼示例，小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧

堆是一棵完全二叉樹。堆分為大根堆和小根堆，大根堆是父節(jié)點大于左右子節(jié)點，并且左右子樹也滿足該性質(zhì)的完全二叉樹。小根堆相反?？梢岳枚褋韺崿F(xiàn)優(yōu)先隊列。

由于是完全二叉樹，所以可以使用數(shù)組來表示堆，索引從0開始[0:length-1]。結(jié)點i的左右子節(jié)點分別為2i+1,2i+2。長度為length的樹的最后一個非葉子節(jié)點為length//2-1。當前節(jié)點i的父節(jié)點為(i-1)//2。其中//表示向下取整。

以大根堆舉例。當每次插入或者刪除的時候，為了保證堆的結(jié)構(gòu)特征不被破壞，需要進行調(diào)整。調(diào)整分為兩種，一種是從上往下，將小的數(shù)下沉。一種是從下往上，令大的數(shù)上浮。

具體實現(xiàn)如下：

首先編寫幾個魔術(shù)方法。包括構(gòu)造函數(shù)，可以直接調(diào)用len來返回data數(shù)組長度的函數(shù)，一個打印data內(nèi)容的函數(shù)

 def __init__(self, data=[]):
    self.data = data
    self.construct_heap()

 def __len__(self):
    return len(self.data)

 def __str__(self):
    return str(self.data)

定義一個swap函數(shù)，來方便的交換數(shù)組中兩個索引處的值。

  def swap(self, i, j):
    self.data[i], self.data[j] = self.data[j], self.data[i]

定義float_up方法，使堆中大的數(shù)能浮上來。當前節(jié)點不為根節(jié)點，并且當前節(jié)點數(shù)據(jù)大小大于父節(jié)點時，上浮。

 def float_up(self, i):
    while i > 0 and self.data[i] > self.data[(i - 1) // 2]:
      self.swap(i, (i - 1) // 2)
      i = (i - 1) // 2

定義sink_down方法，使堆中小的數(shù)沉下去。當前節(jié)點不為葉子節(jié)點時，如果小于左孩子或右孩子的數(shù)據(jù)，則和左右孩子中較大的換一下位置。

def sink_down(self, i):
    while i < len(self) // 2:
      l, r = 2 * i + 1, 2 * i + 2
      if r < len(self) and self.data[l] < self.data[r]:
        l = r
      if self.data[i] < self.data[l]:
        self.swap(i, l)

      i = l

實現(xiàn)append方法，能夠動態(tài)地添加數(shù)據(jù)。在數(shù)據(jù)數(shù)組尾部添加數(shù)據(jù)，然后將數(shù)據(jù)上浮。

  def append(self, data):
    self.data.append(data)
    self.float_up(len(self) - 1)

實現(xiàn)pop_left方法，取堆中最大元素，即優(yōu)先隊列中第一個元素。將數(shù)組中第一個元素與最后一個元素換位置，刪除最后一個元素，然后將第一個元素下沉到合適的位置。

  def pop_left(self):
    self.swap(0, len(self) - 1)
    r = self.data.pop()
    self.sink_down(0)
    return r

如果想在初始化堆的時候，向構(gòu)造函數(shù)中傳入數(shù)據(jù)參數(shù)，則需要一次性將整個堆構(gòu)建完畢，而不能一個一個加入。實現(xiàn)也很簡單，從最后一個非葉節(jié)點開始，逐個執(zhí)行sink_down操作。

  def construct_heap(self):
    for i in range(len(self) // 2 - 1, -1, -1):
      self.sink_down(i)

這樣一個基本的堆的代碼就編寫完畢了。

但是如果我們想要動態(tài)的改變數(shù)據(jù)，當前的堆就不能滿足我們的需求了，因為索引不能總是標識同一個數(shù)據(jù)，因為堆的結(jié)構(gòu)是不斷調(diào)整的。我們需要使用索引堆。

在索引堆中，我們不在堆中直接保存數(shù)據(jù)，而是用在堆中存放數(shù)據(jù)的索引。

如果我們輸入的數(shù)據(jù)arr是 45 20 12 5 35。則arr[0]一直指向45，arr[1]一直指向20，因為我們在調(diào)整堆結(jié)構(gòu)中實際調(diào)整的是索引數(shù)組，而不會改變真實存放數(shù)據(jù)的數(shù)組。

因此我們的代碼需要調(diào)整，首先在構(gòu)造函數(shù)中加入一個索引數(shù)組。下標從0開始，與存放數(shù)據(jù)的數(shù)組的下標相對應。

  def __init__(self, data=[]):
    self.data = data
    self.index_arr = list(range(len(self.data)))
    self.construct_heap()

然后將返回堆長度的魔術(shù)函數(shù)也修改一下。

  def __len__(self):
    return len(self.index_arr)

調(diào)整一下之前定義的swap方法，原來是直接交換數(shù)據(jù)，現(xiàn)在交換索引。

 def swap(self, i, j):
    self.index_arr[i], self.index_arr[j] = self.index_arr[j], self.index_arr[i]

調(diào)整float_up以及sink_down中的相應位置

  def float_up(self, i):
    while i > 0 and self.data[self.index_arr[i]] > self.data[self.index_arr[(i - 1) // 2]]:
      self.swap(i, (i - 1) // 2)
      i = (i - 1) // 2
      
  def sink_down(self, i):
    while i < len(self) // 2:
      l, r = 2 * i + 1, 2 * i + 2
      if r < len(self) and self.data[self.index_arr[l]] < self.data[self.index_arr[r]]:
        l = r
      if self.data[self.index_arr[i]] < self.data[self.index_arr[l]]:
        self.swap(i, l)

      i = l

當append數(shù)據(jù)的時候，要相應的更新index_arr

  def append(self, data):
    self.data.append(data)
    self.index_arr.append(len(self))
    self.float_up(len(self) - 1)

當移出數(shù)據(jù)的時候，之前已經(jīng)提到過存放數(shù)據(jù)的數(shù)組，是按照append的順序進行存儲的，平時操作只是對index_arr的順序進行調(diào)整。

如果data_arr為 42 30 74 60 相應的index_arr應該為2 3 0 1

這時，當我們popleft出最大元素時，data_arr中的74被移出后變成了42 30 60，數(shù)組中最大索引由3變成了2，如果索引數(shù)組中仍然用3這個索引來索引30會造成index溢出。74的索引為2，需要我們將索引數(shù)在2之后的都減1。

綜上，在刪除元素時，我們原先是將data_arr中的首尾元素互換，再刪除尾部元素，再對頭部元素進行sink_down操作。現(xiàn)在我們先換索引數(shù)組中首尾元素，再刪除索引數(shù)組尾部元素，此時尚未操作存放data的data_arr，因此索引數(shù)組剩余元素與data_arr的元素仍是一一對應的。進行sink_down操作，操作完成之后再刪除data_arr相應位置元素。最后將index_arr中值大于原index_arr頭部元素值的減一。

  def pop_left(self):
    self.swap(0, len(self) - 1)
    r = self.index_arr.pop()
    self.sink_down(0)
    self.data.pop(r)

    for i, index in enumerate(self.index_arr):
      if index > r:
        self.index_arr[i] -= 1

    return r

索引堆增加了一個更新操作，可以隨時更新索引堆中的數(shù)據(jù)。更新時，先直接更新data_arr中相應索引處的數(shù)據(jù)，然后在index_arr中，找到存放了data_arr中，剛被更新的數(shù)據(jù)的索引的索引位置，與刪除時一樣需要進行一次遍歷。找到這個位置之后，由于無法確定與前后元素的大小關(guān)系，因此需要進行一次float_up操作再進行一次sink_down操作。

  def update(self, i, data):
    self.data[i] = data
    for index_index, index in enumerate(self.index_arr):
      if index == i:
        target = index_index

    self.float_up(target)
    self.sink_down(target)

可以很明顯看出，這個索引堆在插入元素時是比較快的，但是在刪除元素和更新元素時，為了查找相應位置索引，都進行了一次遍歷，這是很耗時的操作。為了能更快的找到index_arr中值為要更新的data_arr的相應索引值得索引位置，我們再次開辟一個新的數(shù)組to_index，來對index_arr進行索引。

例如對于數(shù)組75 54 65 90

此時它的index_arr為3 0 2 1。當要更新data[3]，即90這個元素時，現(xiàn)在要遍歷一遍index_arr來找到3這個位置，這個位置是0。我們要建立一個to_index，to_index[3]中存放的元素為0。

index_arr存放的元素分別為： 1 3 2 0。

先改變swap數(shù)組，在交換index_arr中元素時，也交換存放在to_index中的index_arr的索引。

 def swap(self, i, j):
    self.index_arr[i], self.index_arr[j] = self.index_arr[j], self.index_arr[i]
    self.to_index[self.index_arr[i]], self.to_index[self.index_arr[j]] = self.to_index[self.index_arr[j]], \
                                       self.to_index[self.index_arr[i]]

然后在update中，當要更新位置為i的元素時，我們就不需要通過一次遍歷才能找到index_arr中該元素的索引，而是直接通過訪問index_arr[i]即可訪問index_arr中相應索引

  def update(self, i, data):
    self.data[i] = data
    target = self.to_index[i]
    self.float_up(target)
    self.sink_down(target)

最后改變pop_left中相應代碼，這時我們需要維護三個數(shù)組，data_arr，index_arr以及to_index。

仍然是首先將index_arr首位元素交換，并pop出尾部元素存放到i中。然后將頭部元素sink_down到相應位置，然后將pop出data_arr索引i處的元素。然后pop出to_index中索引為i的元素，再將index_arr中索引溢出的元素進行調(diào)整。

  def pop_left(self):
    self.swap(0, len(self) - 1)
    r = self.index_arr.pop()

    self.sink_down(0)
    self.data.pop(r)

    self.to_index.pop(r)
    for i in range(r, len(self)):
      self.index_arr[self.to_index[i]] -= 1

    return r

以上就是python實現(xiàn)對和索引堆的具體方式。希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章: