如果 K 的 hash 值在 HashMap 中不存在，則執(zhí)行插入，若存在，則發(fā)生碰撞；
如果 K 的 hash 值在 HashMap 中存在，且它們兩者 equals 返回 true，則更新鍵值對；
如果 K 的 hash 值在 HashMap 中存在，且它們兩者 equals 返回 false，則插入鏈表的尾部（尾插法）或者紅黑樹中（樹的添加方式）。（JDK 1.7 之前使用頭插法、JDK 1.8 使用尾插法）（注意：當碰撞導(dǎo)致鏈表大于 TREEIFY_THRESHOLD = 8 時，就把鏈表轉(zhuǎn)換成紅黑樹）

獲取對象時，將 K 傳給 get() 方法：

調(diào)用 hash(K) 方法（計算 K 的 hash 值）從而獲取該鍵值所在鏈表的數(shù)組下標；
順序遍歷鏈表，equals()方法查找相同 Node 鏈表中 K 值對應(yīng)的 V 值。

hashCode 是定位的，存儲位置；equals是定性的，比較兩者是否相等。

3、當兩個對象的 hashCode 相同會發(fā)生什么？

因為 hashCode 相同，不一定就是相等的（equals方法比較），所以兩個對象所在數(shù)組的下標相同，"碰撞"就此發(fā)生。又因為 HashMap 使用鏈表存儲對象，這個 Node 會存儲到鏈表中。

4、你知道 hash 的實現(xiàn)嗎？為什么要這樣實現(xiàn)？

JDK 1.8 中，是通過 hashCode() 的高 16 位異或低 16 位實現(xiàn)的：(h = k.hashCode()) ^ (h >>> 16)，主要是從速度，功效和質(zhì)量來考慮的，減少系統(tǒng)的開銷，也不會造成因為高位沒有參與下標的計算，從而引起的碰撞。

5、為什么要用異或運算符？

保證了對象的 hashCode 的 32 位值只要有一位發(fā)生改變，整個 hash() 返回值就會改變。盡可能的減少碰撞。

6、HashMap 的 table 的容量如何確定？

loadFactor 是什么？該容量如何變化？這種變化會帶來什么問題？

table 數(shù)組大小是由 capacity 這個參數(shù)確定的，默認是16，也可以構(gòu)造時傳入，最大限制是1<<30；

loadFactor 是裝載因子，主要目的是用來確認table 數(shù)組是否需要動態(tài)擴展，默認值是0.75，比如table 數(shù)組大小為 16，裝載因子為 0.75 時，threshold 就是12，當 table 的實際大小超過 12 時，table就需要動態(tài)擴容；

擴容時，調(diào)用 resize() 方法，將 table 長度變?yōu)樵瓉淼膬杀叮ㄗ⒁馐?table 長度，而不是 threshold）；

如果數(shù)據(jù)很大的情況下，擴展時將會帶來性能的損失，在性能要求很高的地方，這種損失很可能很致命。

7、HashMap中put方法的過程？

答：“調(diào)用哈希函數(shù)獲取Key對應(yīng)的hash值，再計算其數(shù)組下標；

如果沒有出現(xiàn)哈希沖突，則直接放入數(shù)組；如果出現(xiàn)哈希沖突，則以鏈表的方式放在鏈表后面；

如果鏈表長度超過閥值( TREEIFY THRESHOLD==8)，就把鏈表轉(zhuǎn)成紅黑樹，鏈表長度低于6，就把紅黑樹轉(zhuǎn)回鏈表;

如果結(jié)點的key已經(jīng)存在，則替換其value即可；

如果集合中的鍵值對大于12，調(diào)用resize方法進行數(shù)組擴容。”

8、數(shù)組擴容的過程？

創(chuàng)建一個新的數(shù)組，其容量為舊數(shù)組的兩倍，并重新計算舊數(shù)組中結(jié)點的存儲位置。結(jié)點在新數(shù)組中的位置只有兩種，原下標位置或原下標+舊數(shù)組的大小。

9、為什么不一直使用紅黑樹？

拉鏈法導(dǎo)致的鏈表過深問題為什么不用二叉查找樹代替，而選擇紅黑樹？

之所以選擇紅黑樹是為了解決二叉查找樹的缺陷，二叉查找樹在特殊情況下會變成一條線性結(jié)構(gòu)（這就跟原來使用鏈表結(jié)構(gòu)一樣了，造成很深的問題），遍歷查找會非常慢。

而紅黑樹在插入新數(shù)據(jù)后可能需要通過左旋，右旋、變色這些操作來保持平衡，引入紅黑樹就是為了查找數(shù)據(jù)快，解決鏈表查詢深度的問題，我們知道紅黑樹屬于平衡二叉樹，但是為了保持“平衡”是需要付出代價的，但是該代價所損耗的資源要比遍歷線性鏈表要少，所以當長度大于8的時候，會使用紅黑樹，如果鏈表長度很短的話，根本不需要引入紅黑樹，引入反而會慢。

10、說說你對紅黑樹的見解？

每個節(jié)點非紅即黑
根節(jié)點總是黑色的
如果節(jié)點是紅色的，則它的子節(jié)點必須是黑色的（反之不一定）
每個葉子節(jié)點都是黑色的空節(jié)點（NIL節(jié)點）
從根節(jié)點到葉節(jié)點或空子節(jié)點的每條路徑，必須包含相同數(shù)目的黑色節(jié)點（即相同的黑色高度）

11、jdk8中對HashMap做了哪些改變？

在java 1.8中，如果鏈表的長度超過了8，那么鏈表將轉(zhuǎn)換為紅黑樹。（桶的數(shù)量必須大于64，小于64的時候只會擴容）

發(fā)生hash碰撞時，java 1.7 會在鏈表的頭部插入，而java 1.8會在鏈表的尾部插入

在java 1.8中，Entry被Node替代(換了一個馬甲)。

12、HashMap，LinkedHashMap，TreeMap 有什么區(qū)別？

LinkedHashMap 保存了記錄的插入順序，在用 Iterator 遍歷時，先取到的記錄肯定是先插入的；遍歷比 HashMap 慢；

TreeMap 實現(xiàn) SortMap 接口，能夠把它保存的記錄根據(jù)鍵排序（默認按鍵值升序排序，也可以指定排序的比較器）

13、HashMap & TreeMap & LinkedHashMap 使用場景？

一般情況下，使用最多的是 HashMap。

HashMap：在 Map 中插入、刪除和定位元素時；

TreeMap：在需要按自然順序或自定義順序遍歷鍵的情況下；

LinkedHashMap：在需要輸出的順序和輸入的順序相同的情況下。

14、HashMap 和 HashTable 有什么區(qū)別？

HashMap 是線程不安全的，HashTable 是線程安全的；

由于線程安全，所以 HashTable 的效率比不上 HashMap；

HashMap最多只允許一條記錄的鍵為null，允許多條記錄的值為null，而 HashTable不允許；

HashMap 默認初始化數(shù)組的大小為16，HashTable 為 11，前者擴容時，擴大兩倍，后者擴大兩倍+1；

HashMap 需要重新計算 hash 值，而 HashTable 直接使用對象的 hashCode

15、Java 中的另一個線程安全的與 HashMap 極其類似的類是什么？

同樣是線程安全，它與 HashTable 在線程同步上有什么不同？

ConcurrentHashMap 類（是 Java并發(fā)包 java.util.concurrent 中提供的一個線程安全且高效的 HashMap 實現(xiàn)）。

HashTable 是使用 synchronize 關(guān)鍵字加鎖的原理（就是對對象加鎖）；

而針對 ConcurrentHashMap，在 JDK 1.7 中采用分段鎖的方式；JDK 1.8 中直接采用了CAS（無鎖算法）+ synchronized。

16、HashMap & ConcurrentHashMap 的區(qū)別？

除了加鎖，原理上無太大區(qū)別。

HashMap的鍵值對允許有null，但是ConCurrentHashMap 都不允許。

17、為什么 ConcurrentHashMap 比 HashTable 效率要高？

HashTable 使用一把鎖（鎖住整個鏈表結(jié)構(gòu)）處理并發(fā)問題，多個線程競爭一把鎖，容易阻塞；

ConcurrentHashMap

JDK 1.7 中使用分段鎖（ReentrantLock + Segment + HashEntry），相當于把一個 HashMap 分成多個段，每段分配一把鎖，這樣支持多線程訪問。鎖粒度：基于 Segment，包含多個 HashEntry。

JDK 1.8 中使用 CAS + synchronized + Node + 紅黑樹。鎖粒度：Node（首結(jié)點）（實現(xiàn) Map.Entry）。鎖粒度降低了。

18、針對 ConcurrentHashMap 鎖機制具體分析（JDK 1.7 VS JDK 1.8）？

JDK 1.7 中，采用分段鎖的機制，實現(xiàn)并發(fā)的更新操作，底層采用數(shù)組+鏈表的存儲結(jié)構(gòu)，包括兩個核心靜態(tài)內(nèi)部類 Segment 和 HashEntry。

Segment 繼承 ReentrantLock（重入鎖）用來充當鎖的角色，每個 Segment 對象守護每個散列映射表的若干個桶；
HashEntry 用來封裝映射表的鍵-值對；
每個桶是由若干個 HashEntry 對象鏈接起來的鏈表

JDK 1.8 中，采用Node + CAS + Synchronized來保證并發(fā)安全。取消類 Segment，直接用 table 數(shù)組存儲鍵值對；當 HashEntry 對象組成的鏈表長度超過 TREEIFY_THRESHOLD 時，鏈表轉(zhuǎn)換為紅黑樹，提升性能。底層變更為數(shù)組 + 鏈表 + 紅黑樹。

19、ConcurrentHashMap 在 JDK 1.8 中，為什么要使用內(nèi)置鎖 synchronized 來代替重入鎖 ReentrantLock？

粒度降低了；JVM 開發(fā)團隊沒有放棄 synchronized，而且基于 JVM 的 synchronized 優(yōu)化空間更大，更加自然。在大量的數(shù)據(jù)操作下，對于 JVM 的內(nèi)存壓力，基于 API 的 ReentrantLock 會開銷更多的內(nèi)存。

粒度降低了；
JVM 開發(fā)團隊沒有放棄 synchronized，而且基于 JVM 的 synchronized 優(yōu)化空間更大，更加自然。
在大量的數(shù)據(jù)操作下，對于 JVM 的內(nèi)存壓力，基于 API 的 ReentrantLock 會開銷更多的內(nèi)存

20、ConcurrentHashMap 簡單介紹？

重要的常量：

private transient volatile int sizeCtl;

當為負數(shù)時，-1 表示正在初始化，-N 表示 N - 1 個線程正在進行擴容；

當為 0 時，表示 table 還沒有初始化；

當為其他正數(shù)時，表示初始化或者下一次進行擴容的大小。

數(shù)據(jù)結(jié)構(gòu)：

Node 是存儲結(jié)構(gòu)的基本單元，繼承 HashMap 中的 Entry，用于存儲數(shù)據(jù)；

TreeNode 繼承 Node，但是數(shù)據(jù)結(jié)構(gòu)換成了二叉樹結(jié)構(gòu)，是紅黑樹的存儲結(jié)構(gòu)，用于紅黑樹中存儲數(shù)據(jù)；

TreeBin 是封裝 TreeNode 的容器，提供轉(zhuǎn)換紅黑樹的一些條件和鎖的控制。

存儲對象時（put() 方法）：

如果沒有初始化，就調(diào)用 initTable() 方法來進行初始化；

如果沒有 hash 沖突就直接 CAS 無鎖插入；

如果需要擴容，就先進行擴容；

如果存在 hash 沖突，就加鎖來保證線程安全，兩種情況：一種是鏈表形式就直接遍歷到尾端插入，一種是紅黑樹就按照紅黑樹結(jié)構(gòu)插入；

如果該鏈表的數(shù)量大于閥值 8，就要先轉(zhuǎn)換成紅黑樹的結(jié)構(gòu)，break 再一次進入循環(huán)

如果添加成功就調(diào)用 addCount() 方法統(tǒng)計 size，并且檢查是否需要擴容。

擴容方法

transfer()：默認容量為 16，擴容時，容量變?yōu)樵瓉淼膬杀丁?/p>

helpTransfer()：調(diào)用多個工作線程一起幫助進行擴容，這樣的效率就會更高。

獲取對象時（get()方法）：

計算 hash 值，定位到該 table 索引位置，如果是首結(jié)點符合就返回；
如果遇到擴容時，會調(diào)用標記正在擴容結(jié)點 ForwardingNode.find()方法，查找該結(jié)點，匹配就返回；
以上都不符合的話，就往下遍歷結(jié)點，匹配就返回，否則最后就返回 null。

21、ConcurrentHashMap 的并發(fā)度是什么？

程序運行時能夠同時更新 ConccurentHashMap 且不產(chǎn)生鎖競爭的最大線程數(shù)。默認為 16，且可以在構(gòu)造函數(shù)中設(shè)置。

當用戶設(shè)置并發(fā)度時，ConcurrentHashMap 會使用大于等于該值的最小2冪指數(shù)作為實際并發(fā)度（假如用戶設(shè)置并發(fā)度為17，實際并發(fā)度則為32）

22、Hash沖突的幾種解決方法

22.1、開放地址法

使用開放地址法進行建立散列表時，建表前須將表中所有單元中存儲的數(shù)據(jù)置空

22.1.1、線性探測法

如果當前hash值發(fā)生沖突，就在此hash值的基礎(chǔ)上加一個單位，直到不發(fā)生hash沖突。
基本思想：假設(shè)散列表 T[0，m-1],從初始地址D開始探查，則最長的探查序列為：D，D+1，D+2，…，m-1,0,1,2,…,D-1

探查結(jié)束的三種情況：

當前探查的單元為空，則代表查找失敗，如果是插入的話則將key值寫入
當前探查的單元有key值，則代表插入失敗，但是查找成功。
若探查到T[D-1]時，未發(fā)現(xiàn)空單元，也未找到key值，則表示查找失敗并且插入失?。ù藭r表滿）

缺點：

需要另外的程序來處理溢出的情況，一般存儲在一個順序表中。
刪除數(shù)據(jù)時，不能直接置為空，而是需要添加一個被刪除的標記。否則會對以后的查找產(chǎn)生印象（情況1）
容易產(chǎn)生堆聚現(xiàn)象

22.1.2、再平方探測

如果當前hash值發(fā)生沖突，就在此hash值的基礎(chǔ)上加一個單位的平方，如果還是沖突，就在原來的hash值減去一個單位的平方。如果還是沖突就操作兩個單位的平方，三個單位的平方等。

22.1.3、偽隨機探測

如果當前hash值發(fā)生沖突。就用隨機函數(shù)生成一個隨機值，加在原來的hash值上，直到不發(fā)生hash沖突。

22.2、拉鏈法

通過計算出來的hash值，如果發(fā)生沖突，則用鏈表或者紅黑樹進行存儲

在進行插入操作的時候，會先查找所插入的元素是否已經(jīng)存在，查找次數(shù)小于等于裝載因子的大小（裝填因子a = m/n. m表示要裝填的關(guān)鍵字個數(shù) n為：裝載鏈表的數(shù)組的大小，一般情況下m>n）,所以時間復(fù)雜度為O（1）
在進行查詢操作的時候，和上邊的類似，時間復(fù)雜度為O（1）
在進行刪除操作的時候，由于鏈表的結(jié)構(gòu)，所以時間復(fù)雜度也是O（1）
在取出元素的時候，如果hash值相同，會在該鏈表中通過equals（）方法進行比對

與開放地址法相比的優(yōu)點：

處理較為簡單，且無堆積現(xiàn)象，查找時間較短
鏈表的長度是動態(tài)的，適合數(shù)據(jù)規(guī)模不清楚的情況
開放地址法為例減少hash沖突，會使得裝載因子變小，及增大散列表的規(guī)模。這種方式在數(shù)據(jù)規(guī)模較大的時候會浪費很多空間。而使用拉鏈法則可以使裝載因子>1,節(jié)省了空間開銷。
刪除節(jié)點的效率較高

缺點：

指針需要額外的空間，所以當數(shù)據(jù)規(guī)模較小的時候，可以選擇開放地址法。將節(jié)省的指針控件可以用來增加散列表的規(guī)模，是的hash沖突減少

22.3、再哈希法

對于沖突的哈希值再次進行通過哈希函數(shù)進行運算，直到?jīng)]有哈希沖突

22.4、建立公共溢出區(qū)

建立公共溢出區(qū)存儲所有哈希沖突的數(shù)據(jù)

結(jié)束

以上就是java哈希算法HashMap經(jīng)典面試題目匯總解析的詳細內(nèi)容，更多關(guān)于java哈希算法HashMap面試題的資料請關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章:

java哈希算法HashMap經(jīng)典面試題目匯總解析

目錄

1、HashMap 的數(shù)據(jù)結(jié)構(gòu)？

2、HashMap 的工作原理？

3、當兩個對象的 hashCode 相同會發(fā)生什么？

4、你知道 hash 的實現(xiàn)嗎？為什么要這樣實現(xiàn)？

5、為什么要用異或運算符？

6、HashMap 的 table 的容量如何確定？

7、HashMap中put方法的過程？

8、數(shù)組擴容的過程？

9、為什么不一直使用紅黑樹？

10、說說你對紅黑樹的見解？

11、jdk8中對HashMap做了哪些改變？

12、HashMap，LinkedHashMap，TreeMap 有什么區(qū)別？

13、HashMap & TreeMap & LinkedHashMap 使用場景？

14、HashMap 和 HashTable 有什么區(qū)別？

15、Java 中的另一個線程安全的與 HashMap 極其類似的類是什么？

16、HashMap & ConcurrentHashMap 的區(qū)別？

17、為什么 ConcurrentHashMap 比 HashTable 效率要高？

18、針對 ConcurrentHashMap 鎖機制具體分析（JDK 1.7 VS JDK 1.8）？

20、ConcurrentHashMap 簡單介紹？