亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

C++算法之海量數(shù)據(jù)處理方法的總結(jié)分析

 更新時(shí)間:2013年05月29日 09:51:36   作者:  
本篇文章是對(duì)海量數(shù)據(jù)處理方法進(jìn)行了詳細(xì)的總結(jié)與分析,需要的朋友參考下
海量數(shù)據(jù)處理中常用到的技術(shù)
1. Bloom Filtering
基本的Bloom Filtering支持快速的插入和查找操作,是一種hash表技術(shù)?;镜臄?shù)據(jù)結(jié)構(gòu)非常簡(jiǎn)單,容量為m的位數(shù)組,k個(gè)hash函數(shù),將輸入的n個(gè)元素存儲(chǔ)在位數(shù)組里面。
每次插入一個(gè)新的元素,先計(jì)算該元素的k個(gè)hash指,將位數(shù)組對(duì)應(yīng)hash值位置為1. 查找某個(gè)元素時(shí),同樣的先計(jì)算k個(gè)hash值,然后查詢看是否對(duì)應(yīng)位數(shù)組中得k位是否都是1,是則斷定元素存在。
基本的Bloom Filtering算法可以用于允許誤差的快速判重操作。集合的交集、并集的計(jì)算。
Bloom Filtering有個(gè)改進(jìn)的版本counting bloom filtering可以支持?jǐn)?shù)據(jù)的刪除操作,countering bloom filtering和基本的bloom filtering相比,位數(shù)組中每一位的取值擴(kuò)展成多位,基本的bloom filtering用1bit表示一位。插入一個(gè)元素時(shí),所有的k位都加1,刪除時(shí)都減1,查找時(shí)如果k個(gè)值都大于0則判定為存在。CBF中有個(gè)很重要的參數(shù),即每一位的位數(shù)為多少??梢酝ㄟ^(guò)理論證明,位數(shù)一般取4就足夠了,可以支持同一個(gè)數(shù)據(jù)插入16次。
bitmap可以看做bloom filtering的特例
2. Hash表技術(shù)
d-left hash hash表負(fù)載均衡技術(shù)。將hash表分成d段,設(shè)計(jì)d個(gè)hash函數(shù),更具負(fù)載選擇一個(gè)合適的段存放數(shù)據(jù)。查找時(shí)要計(jì)算d個(gè)hash值,分別在d段中找。
常用于統(tǒng)計(jì)次數(shù)。
3. 堆技術(shù)
堆有兩個(gè)典型的應(yīng)用:
多路歸并排序
求TopK
多路歸并排序時(shí),降序排序時(shí)用最大堆,升序排序用最小堆。
TopK時(shí),求TopK最大時(shí),用最小堆,求TopK最小時(shí)用最大堆。求topK最大時(shí),利用最小堆堆維護(hù)K個(gè)值,當(dāng)新掃描的值大于堆頂元素時(shí),堆頂元素刪除,插入新的值。這樣掃描完一遍數(shù)據(jù),既可以求得topK最大。
4. 雙層桶(多層桶)設(shè)計(jì)
hash表技術(shù)是一種direct addr 技術(shù),但是當(dāng)數(shù)據(jù)范圍分布過(guò)廣、且數(shù)據(jù)量非常大的時(shí)候,采用hash表直接direct addr技術(shù)就不行了,這是可以使用多層hash技術(shù)。將原始數(shù)據(jù)范圍分成小段,每一段內(nèi)存可以裝載,段內(nèi)可以使用direct addr table技術(shù)??梢杂枚鄬臃旨?jí)快速定位到小段。

相關(guān)文章

  • C++中的extern “C”用法詳解

    C++中的extern “C”用法詳解

    這篇文章主要介紹了C++中的extern “C”用法詳解,簡(jiǎn)單來(lái)說(shuō),extern “C”是C++聲明或定義C語(yǔ)言符號(hào)的方法,是為了與C兼容,需要的朋友可以參考下
    2015-03-03
  • 大數(shù)(高精度數(shù))模板(分享)

    大數(shù)(高精度數(shù))模板(分享)

    本篇文章對(duì)大數(shù)(高精度數(shù))模板進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下
    2013-05-05
  • C語(yǔ)言運(yùn)算符與表達(dá)式

    C語(yǔ)言運(yùn)算符與表達(dá)式

    這篇文章主要介紹了C語(yǔ)言運(yùn)算符與表達(dá)式,表達(dá)式是C語(yǔ)言的主體。在C語(yǔ)言中,表達(dá)式由操作符和操作數(shù)組成,更多相關(guān)介紹需要的小伙伴可以參考下面文章內(nèi)容
    2022-07-07
  • C語(yǔ)言實(shí)現(xiàn)頁(yè)面置換 先進(jìn)先出算法(FIFO)

    C語(yǔ)言實(shí)現(xiàn)頁(yè)面置換 先進(jìn)先出算法(FIFO)

    這篇文章主要為大家詳細(xì)介紹了C語(yǔ)言實(shí)現(xiàn)頁(yè)面置換,先進(jìn)先出算法(FIFO),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-12-12
  • 關(guān)于c++編譯protobuf時(shí)提示LNK2001 無(wú)法解析的外部符號(hào)的問(wèn)題

    關(guān)于c++編譯protobuf時(shí)提示LNK2001 無(wú)法解析的外部符號(hào)的問(wèn)題

    這篇文章主要介紹了關(guān)于c++編譯protobuf時(shí)提示LNK2001 無(wú)法解析的外部符號(hào)的問(wèn)題,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-12-12
  • C語(yǔ)言中指針的加減運(yùn)算方法示例

    C語(yǔ)言中指針的加減運(yùn)算方法示例

    這篇文章主要給大家介紹了關(guān)于C語(yǔ)言中指針的加減運(yùn)算的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用C語(yǔ)言具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-08-08
  • Qt 儀表盤的實(shí)現(xiàn)示例

    Qt 儀表盤的實(shí)現(xiàn)示例

    儀表盤在很多汽車和物聯(lián)網(wǎng)相關(guān)的系統(tǒng)中很常用,本文就來(lái)介紹一下Qt 儀表盤的實(shí)現(xiàn)示例,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-12-12
  • 深入淺析C/C++?的條件編譯

    深入淺析C/C++?的條件編譯

    條件編譯是指預(yù)處理的時(shí)候根據(jù)條件編譯的指令有條件的選擇源程序中的一部分代碼送給編譯器進(jìn)行編譯,進(jìn)行有選擇性的操作,防止宏替換的內(nèi)容重復(fù)包含,這篇文章主要介紹了C/C++?的條件編譯,需要的朋友可以參考下
    2022-04-04
  • C++實(shí)現(xiàn)LeetCode(10.正則表達(dá)式匹配)

    C++實(shí)現(xiàn)LeetCode(10.正則表達(dá)式匹配)

    這篇文章主要介紹了C++實(shí)現(xiàn)LeetCode(10.正則表達(dá)式匹配),本篇文章通過(guò)簡(jiǎn)要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下
    2021-07-07
  • C語(yǔ)言中基礎(chǔ)小問(wèn)題詳細(xì)介紹

    C語(yǔ)言中基礎(chǔ)小問(wèn)題詳細(xì)介紹

    這篇文章詳細(xì)介紹了C語(yǔ)言中基礎(chǔ)小問(wèn)題,有需要的朋友可以參考一下
    2013-10-10

最新評(píng)論