Java遍歷集合方法分析(實(shí)現(xiàn)原理、算法性能、適用場(chǎng)合)
概述
Java語言中,提供了一套數(shù)據(jù)集合框架,其中定義了一些諸如List、Set等抽象數(shù)據(jù)類型,每個(gè)抽象數(shù)據(jù)類型的各個(gè)具體實(shí)現(xiàn),底層又采用了不同的實(shí)現(xiàn)方式,比如ArrayList和LinkedList。
除此之外,Java對(duì)于數(shù)據(jù)集合的遍歷,也提供了幾種不同的方式。開發(fā)人員必須要清楚的明白每一種遍歷方式的特點(diǎn)、適用場(chǎng)合、以及在不同底層實(shí)現(xiàn)上的表現(xiàn)。下面就詳細(xì)分析一下這一塊內(nèi)容。
數(shù)據(jù)元素是怎樣在內(nèi)存中存放的?
數(shù)據(jù)元素在內(nèi)存中,主要有2種存儲(chǔ)方式:
1、順序存儲(chǔ),Random Access(Direct Access):
這種方式,相鄰的數(shù)據(jù)元素存放于相鄰的內(nèi)存地址中,整塊內(nèi)存地址是連續(xù)的??梢愿鶕?jù)元素的位置直接計(jì)算出內(nèi)存地址,直接進(jìn)行讀取。讀取一個(gè)特定位置元素的平均時(shí)間復(fù)雜度為O(1)。正常來說,只有基于數(shù)組實(shí)現(xiàn)的集合,才有這種特性。Java中以ArrayList為代表。
2、鏈?zhǔn)酱鎯?chǔ),Sequential Access:
這種方式,每一個(gè)數(shù)據(jù)元素,在內(nèi)存中都不要求處于相鄰的位置,每個(gè)數(shù)據(jù)元素包含它下一個(gè)元素的內(nèi)存地址。不可以根據(jù)元素的位置直接計(jì)算出內(nèi)存地址,只能按順序讀取元素。讀取一個(gè)特定位置元素的平均時(shí)間復(fù)雜度為O(n)。主要以鏈表為代表。
Java中以LinkedList為代表。
Java中提供的遍歷方式有哪些?
1、傳統(tǒng)的for循環(huán)遍歷,基于計(jì)數(shù)器的:
遍歷者自己在集合外部維護(hù)一個(gè)計(jì)數(shù)器,然后依次讀取每一個(gè)位置的元素,當(dāng)讀取到最后一個(gè)元素后,停止。主要就是需要按元素的位置來讀取元素。這也是最原始的集合遍歷方法。
寫法為:
for (int i = 0; i < list.size(); i++) { list.get(i); }
2、迭代器遍歷,Iterator:
Iterator本來是OO的一個(gè)設(shè)計(jì)模式,主要目的就是屏蔽不同數(shù)據(jù)集合的特點(diǎn),統(tǒng)一遍歷集合的接口。Java作為一個(gè)OO語言,自然也在Collections中支持了Iterator模式。
寫法為:
Iterator iterator = list.iterator(); while (iterator.hasNext()) { iterator.next(); }
3、foreach循環(huán)遍歷:
屏蔽了顯式聲明的Iterator和計(jì)數(shù)器。
優(yōu)點(diǎn):代碼簡潔,不易出錯(cuò)。
缺點(diǎn):只能做簡單的遍歷,不能在遍歷過程中操作(刪除、替換)數(shù)據(jù)集合。
寫法為:
for (ElementType element : list) { }
每個(gè)遍歷方法的實(shí)現(xiàn)原理是什么?
1、傳統(tǒng)的for循環(huán)遍歷,基于計(jì)數(shù)器的:
遍歷者自己在集合外部維護(hù)一個(gè)計(jì)數(shù)器,然后依次讀取每一個(gè)位置的元素,當(dāng)讀取到最后一個(gè)元素后,停止。主要就是需要按元素的位置來讀取元素。
2、迭代器遍歷,Iterator:
每一個(gè)具體實(shí)現(xiàn)的數(shù)據(jù)集合,一般都需要提供相應(yīng)的Iterator。相比于傳統(tǒng)for循環(huán),Iterator取締了顯式的遍歷計(jì)數(shù)器。所以基于順序存儲(chǔ)集合的Iterator可以直接按位置訪問數(shù)據(jù)。而基于鏈?zhǔn)酱鎯?chǔ)集合的Iterator,正常的實(shí)現(xiàn),都是需要保存當(dāng)前遍歷的位置。然后根據(jù)當(dāng)前位置來向前或者向后移動(dòng)指針。
3、foreach循環(huán)遍歷:
根據(jù)反編譯的字節(jié)碼可以發(fā)現(xiàn),foreach內(nèi)部也是采用了Iterator的方式實(shí)現(xiàn),只不過Java編譯器幫我們生成了這些代碼。
各遍歷方式對(duì)于不同的存儲(chǔ)方式,性能如何?
1、傳統(tǒng)的for循環(huán)遍歷,基于計(jì)數(shù)器的:
因?yàn)槭腔谠氐奈恢?,按位置讀取。所以我們可以知道,對(duì)于順序存儲(chǔ),因?yàn)樽x取特定位置元素的平均時(shí)間復(fù)雜度是O(1),所以遍歷整個(gè)集合的平均時(shí)間復(fù)雜度為O(n)。而對(duì)于鏈?zhǔn)酱鎯?chǔ),因?yàn)樽x取特定位置元素的平均時(shí)間復(fù)雜度是O(n),所以遍歷整個(gè)集合的平均時(shí)間復(fù)雜度為O(n2)(n的平方)。
ArrayList按位置讀取的代碼:直接按元素位置讀取。
transient Object[] elementData; public E get(int index) { rangeCheck(index); return elementData(index); } E elementData(int index) { return (E) elementData[index]; }
LinkedList按位置讀取的代碼:每次都需要從第0個(gè)元素開始向后讀取。其實(shí)它內(nèi)部也做了小小的優(yōu)化。
transient int size = 0; transient Node<E> first; transient Node<E> last; public E get(int index) { checkElementIndex(index); return node(index).item; } Node<E> node(int index) { if (index < (size >> 1)) { //查詢位置在鏈表前半部分,從鏈表頭開始查找 Node<E> x = first; for (int i = 0; i < index; i++) x = x.next; return x; } else { //查詢位置在鏈表后半部分,從鏈表尾開始查找 Node<E> x = last; for (int i = size - 1; i > index; i--) x = x.prev; return x; } }
2、迭代器遍歷,Iterator:
那么對(duì)于RandomAccess類型的集合來說,沒有太多意義,反而因?yàn)橐恍╊~外的操作,還會(huì)增加額外的運(yùn)行時(shí)間。但是對(duì)于Sequential Access的集合來說,就有很重大的意義了,因?yàn)镮terator內(nèi)部維護(hù)了當(dāng)前遍歷的位置,所以每次遍歷,讀取下一個(gè)位置并不需要從集合的第一個(gè)元素開始查找,只要把指針向后移一位就行了,這樣一來,遍歷整個(gè)集合的時(shí)間復(fù)雜度就降低為O(n);
(這里只用LinkedList做例子)LinkedList的迭代器,內(nèi)部實(shí)現(xiàn),就是維護(hù)當(dāng)前遍歷的位置,然后操作指針移動(dòng)就可以了:
代碼:
public E next() { checkForComodification(); if (!hasNext()) throw new NoSuchElementException(); lastReturned = next; next = next.next; nextIndex++; return lastReturned.item; } public E previous() { checkForComodification(); if (!hasPrevious()) throw new NoSuchElementException(); lastReturned = next = (next == null) ? last : next.prev; nextIndex--; return lastReturned.item; }
3、foreach循環(huán)遍歷:
分析Java字節(jié)碼可知,foreach內(nèi)部實(shí)現(xiàn)原理,也是通過Iterator實(shí)現(xiàn)的,只不過這個(gè)Iterator是Java編譯器幫我們生成的,所以我們不需要再手動(dòng)去編寫。但是因?yàn)槊看味家鲱愋娃D(zhuǎn)換檢查,所以花費(fèi)的時(shí)間比Iterator略長。時(shí)間復(fù)雜度和Iterator一樣。
使用Iterator的字節(jié)碼:
Code: new # // class java/util/ArrayList dup invokespecial # // Method java/util/ArrayList."<init>":()V astore_ aload_ invokeinterface #, // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator; astore_ goto aload_ invokeinterface #, // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object; pop aload_ invokeinterface #, // InterfaceMethod java/util/Iterator.hasNext:()Z ifne return
使用foreach的字節(jié)碼:
Code: new # // class java/util/ArrayList dup invokespecial # // Method java/util/ArrayList."<init>":()V astore_ aload_ invokeinterface #, // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator; astore_ goto aload_ invokeinterface #, // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object; checkcast # // class loop/Model astore_ aload_ invokeinterface #, // InterfaceMethod java/util/Iterator.hasNext:()Z ifne return
各遍歷方式的適用于什么場(chǎng)合?
1、傳統(tǒng)的for循環(huán)遍歷,基于計(jì)數(shù)器的:
順序存儲(chǔ):讀取性能比較高。適用于遍歷順序存儲(chǔ)集合。
鏈?zhǔn)酱鎯?chǔ):時(shí)間復(fù)雜度太大,不適用于遍歷鏈?zhǔn)酱鎯?chǔ)的集合。
2、迭代器遍歷,Iterator:
順序存儲(chǔ):如果不是太在意時(shí)間,推薦選擇此方式,畢竟代碼更加簡潔,也防止了Off-By-One的問題。
鏈?zhǔn)酱鎯?chǔ):意義就重大了,平均時(shí)間復(fù)雜度降為O(n),還是挺誘人的,所以推薦此種遍歷方式。
3、foreach循環(huán)遍歷:
foreach只是讓代碼更加簡潔了,但是他有一些缺點(diǎn),就是遍歷過程中不能操作數(shù)據(jù)集合(刪除等),所以有些場(chǎng)合不使用。而且它本身就是基于Iterator實(shí)現(xiàn)的,但是由于類型轉(zhuǎn)換的問題,所以會(huì)比直接使用Iterator慢一點(diǎn),但是還好,時(shí)間復(fù)雜度都是一樣的。所以怎么選擇,參考上面兩種方式,做一個(gè)折中的選擇。
Java的最佳實(shí)踐是什么?
Java數(shù)據(jù)集合框架中,提供了一個(gè)RandomAccess接口,該接口沒有方法,只是一個(gè)標(biāo)記。通常被List接口的實(shí)現(xiàn)使用,用來標(biāo)記該List的實(shí)現(xiàn)是否支持Random Access。
一個(gè)數(shù)據(jù)集合實(shí)現(xiàn)了該接口,就意味著它支持Random Access,按位置讀取元素的平均時(shí)間復(fù)雜度為O(1)。比如ArrayList。
而沒有實(shí)現(xiàn)該接口的,就表示不支持Random Access。比如LinkedList。
所以看來JDK開發(fā)者也是注意到這個(gè)問題的,那么推薦的做法就是,如果想要遍歷一個(gè)List,那么先判斷是否支持Random Access,也就是 list instanceof RandomAccess。
比如:
if (list instanceof RandomAccess) { //使用傳統(tǒng)的for循環(huán)遍歷。 } else { //使用Iterator或者foreach。 }
以上所述是小編給大家介紹的Java遍歷集合方法分析(實(shí)現(xiàn)原理、算法性能、適用場(chǎng)合),希望對(duì)大家有所幫助!
相關(guān)文章
使用JavaScript制作待辦事項(xiàng)列表的示例代碼
這篇文章主要介紹了如何使用 JavaScript創(chuàng)建待辦事項(xiàng)列表HTML的完整信息和教程,文中但是示例代碼講解詳細(xì),感興趣的同學(xué)可以動(dòng)手試一試2022-01-01隨鼠標(biāo)移動(dòng)的時(shí)鐘非常漂亮遺憾的是只支持IE
這篇文章主要介紹了隨鼠標(biāo)移動(dòng)的時(shí)鐘非常漂亮遺憾的是只支持IE,需要的朋友可以參考下2014-08-08靜態(tài)的動(dòng)態(tài)續(xù)篇之來點(diǎn)XML
靜態(tài)的動(dòng)態(tài)續(xù)篇之來點(diǎn)XML...2006-12-12gulp-htmlmin壓縮html的gulp插件實(shí)例代碼
這篇文章主要介紹了gulp-htmlmin壓縮html的gulp插件實(shí)例代碼的相關(guān)資料,需要的朋友可以參考下2016-06-06js刪除數(shù)組中的元素delete和splice的區(qū)別詳解
下面小編就為大家分享一篇js刪除數(shù)組中的元素delete和splice的區(qū)別詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-02-02詳解Webpack如何引入CDN鏈接來優(yōu)化編譯后的體積
這篇文章主要介紹了詳解Webpack如何引入CDN鏈接來優(yōu)化編譯后的體積,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-06-06