Java集合-HashMap
概述
①以數(shù)組+鏈表+紅黑樹實(shí)現(xiàn)。主要用來處理具有鍵值對特征的數(shù)據(jù)。
②當(dāng)鏈表長度大于閾值(或者紅黑樹的邊界值,默認(rèn)為 8 )并且當(dāng)前數(shù)組的長度大于 64 時,此時此索引位置上的所有數(shù)據(jù)改為使用紅黑樹存儲。
③補(bǔ)充:將鏈表轉(zhuǎn)換成紅黑樹前會判斷,即便閾值大于 8,但是數(shù)組長度小于 64,此時并不會將鏈表變?yōu)榧t黑樹,而是選擇逬行數(shù)組擴(kuò)容。
④每個Node節(jié)點(diǎn)存儲著用來定位數(shù)據(jù)索引位置的hash值,K鍵,V值以及指向鏈表下一個節(jié)點(diǎn)的Node<K,V> next節(jié)點(diǎn)組成。
⑤Node是HashMap的內(nèi)部類,實(shí)現(xiàn)了Map.Entry接口,本質(zhì)是一個鍵值對。
⑥這樣做的目的是因?yàn)閿?shù)組比較小,盡量避開紅黑樹結(jié)構(gòu),這種情況下變?yōu)榧t黑樹結(jié)構(gòu),反而會降低效率,因?yàn)榧t黑樹需要逬行左旋,右旋,變色這些操作來保持平衡。同時數(shù)組長度小于64時,搜索時間相對要快些。所以結(jié)上所述為了提高性能和減少搜索時間,底層閾值大于8并且數(shù)組長度大于64時,鏈表才轉(zhuǎn)換為紅黑樹。
重要的參數(shù)
①容量(Capacity
)和負(fù)載因子(Load factor
)
②初始容量:容量是哈希表中桶的個數(shù),初始容量是創(chuàng)建哈希表時的容量。
③負(fù)載因子:負(fù)載因子是衡量哈希表在自動增加容量之前允許其達(dá)到多滿的指標(biāo)。 默認(rèn)0.75
④threshold:threshold表示所能容納的鍵值對的臨界值。計(jì)算公式為 數(shù)組長度 * 負(fù)載因子。
⑤size:size是hashmap
中實(shí)際存在的鍵值對數(shù)量。
⑥modCount:用來記錄hashmap
內(nèi)部結(jié)構(gòu)發(fā)生變化的次數(shù)。
put函數(shù)的實(shí)現(xiàn)
大致思路:
對key的hashCode()
做hash,然后再計(jì)算index;
如果沒碰撞直接放到bucket里;
如果碰撞了,以鏈表的形式存在buckets后;
如果碰撞導(dǎo)致鏈表過長(大于等于 TREEIFY_THRESHOLD )就把鏈表轉(zhuǎn)換成紅黑樹;
如果節(jié)點(diǎn)已經(jīng)存在就替換old value(保證key的唯一性)
如果bucket滿了(超過 load factor*current capacity ),就要resize(調(diào)整大小)。
get函數(shù)的實(shí)現(xiàn)
大致思路:
- bucket里的第一個節(jié)點(diǎn),直接命中;
- 如果有沖突,則通過key.equals(k)去查找對應(yīng)的entry若為樹,則在樹中通過key.equals(k)查找,O(logn);若為鏈表,則在鏈表中通過key.equals(k)查找,O(n)。
hash函數(shù)的實(shí)現(xiàn)
//高16bit不變,低16bit和高16bit做了一個異或 static final int hash(Object key) { ?? ?int h; ?? ?return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); }
獲取HashMap的元素時,基本分兩步:
- 1.首先根據(jù)
hashCode()
做hash,然后確定bucket的index; - 2.如果
bucket
的節(jié)點(diǎn)的key不是我們需要的,則通過keys.equals()在鏈表(紅黑樹)中找。
RESIZE的實(shí)現(xiàn)
當(dāng)put時,如果發(fā)現(xiàn)目前的bucket占用程度已經(jīng)超過了Load Factor所希望的比例,那么就會發(fā)生resize。
在resize
的過程,簡單的說就是把bucket擴(kuò)充為2倍,之后重
新計(jì)算index,把節(jié)點(diǎn)再放到新的bucket中。元素的位置要么是在原位置,要么是在原位置再移動2次冪的位置。省去了重新計(jì)算hash值的時間,把之前的沖突的節(jié)點(diǎn)分散到新的bucket了
什么時候會使用HashMap?他有什么特點(diǎn)?
是基于Map接口的實(shí)現(xiàn),存儲鍵值對時,它可以接收null的鍵值,是非同步的,HashMap存儲著Entry(hash, key, value, next)對象。
** 你知道HashMap的工作原理嗎?**
通過hash的方法,通過put和get存儲和獲取對象。存儲對象時,我們將K/V傳給put方法時,它調(diào)用hashCode計(jì)算hash從而得到bucket位置,進(jìn)一步存儲,HashMapJava集合——HashMap會根據(jù)當(dāng)前bucket的占用情況自動調(diào)整容量(超過 Load Facotr 則resize為原來的2倍)。獲取對象時,我們將K傳給get,它調(diào)用hashCode計(jì)算hash從而得到bucket位置,并進(jìn)一步調(diào)用equals()方法確定鍵值對。如果發(fā)生碰撞的時候,Hashmap通過鏈表將產(chǎn)生碰撞沖突的元素組織起來,在Java 8中,如果一個bucket中碰撞沖突的元素超過某個限制(默認(rèn)是8),則使用紅黑樹來替換鏈表,從而提高速度。
你知道get和put的原理嗎?equals()和hashCode()的都有什么作用?
通過對key的hashCode()進(jìn)行hashing,并計(jì)算下標(biāo)( (n-1) & hash ),從而獲得buckets的位置。如果產(chǎn)生碰撞,則利用key.equals()方法去鏈表或樹中去查找對應(yīng)的節(jié)點(diǎn)。
hash的實(shí)現(xiàn),為什么要這樣實(shí)現(xiàn)?
在Java 1.8的實(shí)現(xiàn)中,是通過hashCode()的高16位異或低16位實(shí)現(xiàn)的: (h =k.hashCode()) ^ (h >>> 16) ,主要是從速度、功效、質(zhì)量來考慮的,這么做可以在bucket的n比較小的時候,也能保證考慮到高低bit都參與到hash的計(jì)算中,同時不會有太大的開銷。
如果HashMap的大小超過了負(fù)載因子( load factor )定義的容量,怎么辦?
如果超過了負(fù)載因子(默認(rèn)0.75),則會重新resize一個原來長度兩倍的HashMap,并且重新調(diào)用hash方法。
到此這篇關(guān)于Java集合-HashMap的文章就介紹到這了,更多相關(guān)Java集合HashMap內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
解決idea2020.2遇到pom.xml文件報(bào)錯maven插件tomcat7的問題
這篇文章主要介紹了idea2020.2遇到pom.xml文件報(bào)錯maven插件tomcat7的問題,本文給大家分享解決方法,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-09-09Java正則表達(dá)式學(xué)習(xí)之分組與替換
這篇文章主要給大家介紹了關(guān)于Java正則表達(dá)式學(xué)習(xí)之分組與替換的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-09-09在controller中如何設(shè)置接收參數(shù)的默認(rèn)值
這篇文章主要介紹了在controller中如何設(shè)置接收參數(shù)的默認(rèn)值,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-03-03idea企業(yè)開發(fā)之新建各類型項(xiàng)目的詳細(xì)教程
這篇文章主要介紹了idea企業(yè)開發(fā)之新建各類型項(xiàng)目的詳細(xì)教程,本文通過圖文并茂的形式給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-12-12