亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Redis實(shí)現(xiàn)布隆過濾器的方法及原理

 更新時(shí)間:2019年12月08日 14:20:54   作者:平頭一哥  
布隆過濾器優(yōu)點(diǎn)是空間效率和查詢時(shí)間都比一般的算法要好的多,缺點(diǎn)是有一定的誤識別率和刪除困難。本文將介紹布隆過濾器的原理以及Redis如何實(shí)現(xiàn)布隆過濾器,感興趣的朋友跟隨小編一起看看吧

布隆過濾器(Bloom Filter)是1970年由布隆提出的。它實(shí)際上是一個(gè)很長的二進(jìn)制向量和一系列隨機(jī)映射函數(shù)。布隆過濾器可以用于檢索一個(gè)元素是否在一個(gè)集合中。它的優(yōu)點(diǎn)是空間效率和查詢時(shí)間都比一般的算法要好的多,缺點(diǎn)是有一定的誤識別率和刪除困難。

本文將介紹布隆過濾器的原理以及Redis如何實(shí)現(xiàn)布隆過濾器。

應(yīng)用場景

1、50億個(gè)電話號碼,現(xiàn)有10萬個(gè)電話號碼,如何判斷這10萬個(gè)是否已經(jīng)存在在50億個(gè)之中?(可能方案:數(shù)據(jù)庫,set, hyperloglog)
2、新聞客戶端看新聞時(shí),它會不斷推薦新的內(nèi)容,每次推薦時(shí)都要去重,那么如何實(shí)現(xiàn)推送去重?
3、爬蟲URL去重?
4、NoSQL數(shù)據(jù)庫領(lǐng)域降低數(shù)據(jù)庫的IO請求數(shù)量?
5、郵箱系統(tǒng)的垃圾郵件過濾?

布隆過濾器(Bloom Filter)就是專門來解決這種問題的,它起到去重的同時(shí),在空間上還能節(jié)省90%以上,只是存在一定的誤判概率。

認(rèn)識布隆過濾器

布隆過濾器是一種類似set的數(shù)據(jù)結(jié)構(gòu),只是不太準(zhǔn)確,當(dāng)用bf.exists判斷元素是否存在時(shí)返回結(jié)果存在但真實(shí)不一定存在;當(dāng)返回不存在時(shí)肯定是不存在,所以判斷去重時(shí)有一定的誤判概率。
當(dāng)然,誤判只會發(fā)生在過濾器沒有添加過的元素,對于添加過的元素不會發(fā)生誤判。
特點(diǎn):高效地插入和查詢,占用空間少,返回的結(jié)果是不確定性的。

布隆過濾器原理

每個(gè)布隆過濾器對應(yīng)到Redis的數(shù)據(jù)結(jié)構(gòu)中就是一個(gè)大型的位數(shù)組和幾個(gè)不同的無偏hash函數(shù),無偏表示分布均勻。

添加key時(shí),使用多個(gè)hash函數(shù)對key進(jìn)行hash運(yùn)算得到一個(gè)整數(shù)索引值,對位數(shù)組長度進(jìn)行取模運(yùn)算得到一個(gè)位置,每個(gè)hash函數(shù)都會得到一個(gè)不同的位置,將這幾個(gè)位置都置1就完成了add操作。

查詢同理,只要有一位是0就表示這個(gè)key不存在,但如果都是1,則不一定存在對應(yīng)的key。

空間占用估計(jì)

布隆過濾器的空間占用有一個(gè)簡單的計(jì)算公式,但推導(dǎo)比較繁瑣。布隆過濾器有兩個(gè)參數(shù),預(yù)計(jì)元素?cái)?shù)量n,錯(cuò)誤率f,公式得到兩個(gè)輸出,位數(shù)組長度L(即存儲空間大小bit),hash函數(shù)的最佳數(shù)量k。

k = 0.7*(1/n)
f = 0.6185^(L/n)

1、位數(shù)組相對長度越長,錯(cuò)誤率越低;
2、位數(shù)組相對長度越長,需要的hash函數(shù)越多;
3、當(dāng)一個(gè)元素平均需要一個(gè)字節(jié)(8bit)的指紋空間時(shí)(L/n=8),錯(cuò)誤率大約為2%。

實(shí)際元素超出時(shí),誤判率會怎樣變化?

f = (1-0.5^t)^k  # t為實(shí)際元素與預(yù)計(jì)元素的倍數(shù)
1、當(dāng)錯(cuò)誤率為10%時(shí),倍數(shù)比為2時(shí),錯(cuò)誤率接近40%;
2、當(dāng)錯(cuò)誤率為1%,倍數(shù)比為2時(shí),錯(cuò)誤率15%;
3、當(dāng)錯(cuò)誤率為0.1%,倍數(shù)為2時(shí),錯(cuò)誤率5%

Redis實(shí)現(xiàn)簡單Bloom Filter

要想使用redis提供的布隆過濾器,必須添加redis 4.0版本以上的插件才行,具體參照網(wǎng)上安裝步驟。

布隆過濾器有兩個(gè)基本指令,bf.add添加元素,bf.exists查詢元素是否存在,bf.madd一次添加多個(gè)元素,bf.mexists一次查詢多個(gè)元素。

> bf.add spiderurl www.baidu.com
> bf.exists spiderurl www.baidu.com
> bf.madd spiderurl www.sougou.com www.jd.com
> bf.mexists spiderurl www.jd.com www.taobao.com

布隆過濾器在第一次add的時(shí)候自動創(chuàng)建基于默認(rèn)參數(shù)的過濾器,Redis還提供了自定義參數(shù)的布隆過濾器。

在add之前使用bf.reserve指令顯式創(chuàng)建,其有3個(gè)參數(shù),key,error_rate, initial_size,錯(cuò)誤率越低,需要的空間越大,error_rate表示預(yù)計(jì)錯(cuò)誤率,initial_size參數(shù)表示預(yù)計(jì)放入的元素?cái)?shù)量,當(dāng)實(shí)際數(shù)量超過這個(gè)值時(shí),誤判率會上升,所以需要提前設(shè)置一個(gè)較大的數(shù)值來避免超出。

默認(rèn)的error_rate是0.01,initial_size是100。

利用布隆過濾器減少磁盤 IO 或者網(wǎng)絡(luò)請求,因?yàn)橐坏┮粋€(gè)值必定不存在的話,我們可以不用進(jìn)行后續(xù)昂貴的查詢請求。

總結(jié)

以上所述是小編給大家介紹的Redis實(shí)現(xiàn)布隆過濾器的方法及原理,希望對大家有所幫助,如果大家有任何疑問歡迎給我留言,小編會及時(shí)回復(fù)大家的!

相關(guān)文章

  • redis啟動和退出命令行簡單操作步驟

    redis啟動和退出命令行簡單操作步驟

    Redis是一種鍵值存儲數(shù)據(jù)庫,用戶可以使用它來存儲和檢索大量的鍵值數(shù)據(jù),下面這篇文章主要給大家介紹了關(guān)于redis啟動和退出命令行的相關(guān)資料,需要的朋友可以參考下
    2024-03-03
  • Redis面試必會的題目

    Redis面試必會的題目

    這篇文章主要介紹了Redis面試必會的題目,幫助大家更好的理解和學(xué)習(xí)redis數(shù)據(jù)庫,感興趣的朋友可以了解下
    2020-08-08
  • redis與memcached的區(qū)別_動力節(jié)點(diǎn)Java學(xué)院整理

    redis與memcached的區(qū)別_動力節(jié)點(diǎn)Java學(xué)院整理

    Memcached是以LiveJurnal旗下Danga Interactive公司的Bard Fitzpatric為首開發(fā)的高性能分布式內(nèi)存緩存服務(wù)器。那么redis與memcached有什么區(qū)別呢?下面小編給大家介紹下redis與memcached的區(qū)別,感興趣的朋友參考下吧
    2017-08-08
  • 基于Redis實(shí)現(xiàn)基本搶紅包算法詳解

    基于Redis實(shí)現(xiàn)基本搶紅包算法詳解

    [key, value]的緩存數(shù)據(jù)庫, Redis官方性能描述非常高, 所以面對高并發(fā)場景, 使用Redis來克服高并發(fā)壓力是一個(gè)不錯(cuò)的手段, 本文主要基于Redis來實(shí)現(xiàn)基本的搶紅包系統(tǒng)設(shè)計(jì),感興趣的朋友跟隨小編一起看看吧
    2024-04-04
  • redis 實(shí)現(xiàn)登陸次數(shù)限制的思路詳解

    redis 實(shí)現(xiàn)登陸次數(shù)限制的思路詳解

    這篇文章主要介紹了redis 實(shí)現(xiàn)登陸次數(shù)限制的思路詳解,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2019-08-08
  • Redis如何一鍵部署腳本

    Redis如何一鍵部署腳本

    這篇文章主要介紹了Redis如何一鍵部署腳本,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-04-04
  • Redis序列化存儲及日期格式的問題處理

    Redis序列化存儲及日期格式的問題處理

    這篇文章主要介紹了Redis序列化存儲及其日期格式的問題處理方式,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-12-12
  • redis實(shí)現(xiàn)多級緩存同步方案詳解

    redis實(shí)現(xiàn)多級緩存同步方案詳解

    這篇文章主要介紹了redis實(shí)現(xiàn)多級緩存同步方案詳解,本文通過示例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2022-12-12
  • Redis教程(十二):服務(wù)器管理命令總結(jié)

    Redis教程(十二):服務(wù)器管理命令總結(jié)

    這篇文章主要介紹了Redis教程(十二):服務(wù)器管理命令總結(jié),本文講解了CONFIGGETparameter、CONFIG SETparameter value、FLUSHALL等命令,需要的朋友可以參考下
    2015-04-04
  • Redis 數(shù)據(jù)類型Streams詳解

    Redis 數(shù)據(jù)類型Streams詳解

    Redis Streams是Redis 5.0新增的數(shù)據(jù)類型,提供了一種日志結(jié)構(gòu)化數(shù)據(jù)存儲方式,這種類型適合用于構(gòu)建消息隊(duì)列、事件日志和處理時(shí)間序列數(shù)據(jù)的應(yīng)用,本文介紹Redis 數(shù)據(jù)類型Streams相關(guān)知識,感興趣的朋友一起看看吧
    2024-10-10

最新評論