Java 基于雪花算法生成分布式id
SnowFlake算法原理介紹
在分布式系統(tǒng)中會(huì)將一個(gè)業(yè)務(wù)的系統(tǒng)部署到多臺(tái)服務(wù)器上,用戶隨機(jī)訪問(wèn)其中一臺(tái),而之所以引入分布式系統(tǒng)就是為了讓整個(gè)系統(tǒng)能夠承載更大的訪問(wèn)量。諸如訂單號(hào)這些我們需要它是全局唯一的,同時(shí)我們基本上都會(huì)將它作為查詢條件;出于系統(tǒng)安全考慮不應(yīng)當(dāng)讓其它人輕易的就猜出我們的訂單號(hào),同時(shí)也要防止公司的競(jìng)爭(zhēng)對(duì)手直接通過(guò)訂單號(hào)猜測(cè)出公司業(yè)務(wù)體量;為了保證系統(tǒng)的快速響應(yīng)那么生成算法不能太耗時(shí)。而雪花算法正好解決了這些問(wèn)題。
SnowFlake 算法(雪花算法), 是Twitter開(kāi)源的分布式id生成算法。其核心思想就是: 使用一個(gè)64 bit的long型的數(shù)字作為全局唯一id。它的結(jié)構(gòu)如下:
下面我們來(lái)對(duì)每一部分進(jìn)一步的分析:
- 符號(hào)標(biāo)識(shí)位(1位):計(jì)算機(jī)中為了區(qū)分負(fù)數(shù)(1)和正數(shù)(0),設(shè)計(jì)者將第一位做為符號(hào)位,ID通常使用正數(shù),因此最高位固定為0;
- 41位時(shí)間截(毫秒),這個(gè)是使用 當(dāng)前時(shí)間 減去 開(kāi)始時(shí)間 得到的值;因此一旦我們的算法投入使用,那么程序中設(shè)置的開(kāi)始時(shí)間就不能再去隨意更改了,否則將可能出現(xiàn)重復(fù)的id值;
由于是基于時(shí)間來(lái)實(shí)現(xiàn)的且只有41位,由此可以計(jì)算出該算法只能使用70年左右:(2^41)/(1000*60*60*24*365) = 69.7 年 ;
- 10位機(jī)器ID:共計(jì)1024個(gè)節(jié)點(diǎn),通常將其分為2部分:機(jī)房ID(dataCenterId) 和 機(jī)器ID(workerId);
- 12 位序列號(hào):毫秒內(nèi)的計(jì)數(shù),共計(jì)4098個(gè);簡(jiǎn)單來(lái)說(shuō)就是每毫秒內(nèi)從0開(kāi)始計(jì)算得到值;
- 最終SnowFlake算法總結(jié)如下:整體上按照時(shí)間自增排序,并且整個(gè)分布式系統(tǒng)內(nèi)不會(huì)產(chǎn)生ID 碰撞(由機(jī)房ID和機(jī)器ID作區(qū)分),并且效率較高。最多支持1024臺(tái)機(jī)器,每臺(tái)機(jī)器每毫秒能夠生成最多4096個(gè)ID,整個(gè)集群理論上每秒可以生成 1024 * 1000 * 4096 = 42 億個(gè)ID。
這里不要覺(jué)得每毫秒4098個(gè)ID少了,我們計(jì)算一下每臺(tái)機(jī)器理論上每秒可以支持 4096*1000 = 400萬(wàn)左右;要知道天貓雙11那么大的訂單量每秒也才50萬(wàn)筆;因此是完全夠用的。
算法實(shí)現(xiàn)
我們?cè)谏厦嬉呀?jīng)了解了SnowFlake的算法結(jié)構(gòu),下面是Java版本的實(shí)現(xiàn)。注意我們?cè)趯?shí)現(xiàn)該算法時(shí),不一定要死死的按照上面的來(lái)實(shí)現(xiàn),可以根據(jù)自身業(yè)務(wù)情況進(jìn)行定制化;比如說(shuō)機(jī)器ID,對(duì)于大部分的小項(xiàng)目來(lái)說(shuō)根本不會(huì)分啥機(jī)房,因此我們完全可以根據(jù)服務(wù)器IP來(lái)弄;同時(shí)Twitter公布的算法中最終生成的id長(zhǎng)度為15,但是還是根據(jù)自身業(yè)務(wù)情況進(jìn)行調(diào)整。比如標(biāo)準(zhǔn)的算法只支持使用70年左右,但是我們可以通過(guò)擴(kuò)展長(zhǎng)度來(lái)增加年限。
public class SnowFlakeIdWorker { /** * 開(kāi)始時(shí)間戳,單位毫秒;這里是2021-06-01 */ private static final long TW_EPOCH = 1622476800000L; /** * 機(jī)器 ID 所占的位數(shù) */ private static final long WORKER_ID_BITS = 5L; /** * 數(shù)據(jù)標(biāo)識(shí) ID 所占的位數(shù) */ private static final long DATA_CENTER_ID_BITS = 5L; /** * 支持的最大機(jī)器ID,最大為31 * * PS. Twitter的源碼是 -1L ^ (-1L << workerIdBits);這里最后和-1進(jìn)行異或運(yùn)算,由于-1的二進(jìn)制補(bǔ)碼的特殊性,就相當(dāng)于進(jìn)行取反。 */ private static final long MAX_WORKER_ID = ~(-1L << WORKER_ID_BITS); /** * 支持的最大機(jī)房ID,最大為31 */ private static final long MAX_DATA_CENTER_ID = ~(-1L << DATA_CENTER_ID_BITS); /** * 序列在 ID 中占的位數(shù) */ private static final long SEQUENCE_BITS = 12L; /** * 機(jī)器 ID 向左移12位 */ private static final long WORKER_ID_SHIFT = SEQUENCE_BITS; /** * 機(jī)房 ID 向左移17位 */ private static final long DATA_CENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS; /** * 時(shí)間截向左移22位 */ private static final long TIMESTAMP_LEFT_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATA_CENTER_ID_BITS; /** * 生成序列的掩碼最大值,最大為4095 */ private static final long SEQUENCE_MASK = ~(-1L << SEQUENCE_BITS); /** * 工作機(jī)器 ID(0~31) */ private final long workerId; /** * 機(jī)房 ID(0~31) */ private final long dataCenterId; /** * 毫秒內(nèi)序列(0~4095) */ private long sequence = 0L; /** * 上次生成 ID 的時(shí)間戳 */ private long lastTimestamp = -1L; /** * 創(chuàng)建 ID 生成器的方式一: 使用工作機(jī)器的序號(hào)(也就是將機(jī)房的去掉給機(jī)器ID使用),范圍是 [0, 1023],優(yōu)點(diǎn)是方便給機(jī)器編號(hào) * * @param workerId 工作機(jī)器 ID */ public SnowFlakeIdWorker(long workerId) { // 計(jì)算最大值 long maxMachineId = (MAX_DATA_CENTER_ID + 1) * (MAX_WORKER_ID + 1) - 1; if (workerId < 0 || workerId > maxMachineId) { throw new IllegalArgumentException(String.format("Worker ID can't be greater than %d or less than 0", maxMachineId)); } // 取高位部分作為機(jī)房ID部分 this.dataCenterId = (workerId >> WORKER_ID_BITS) & MAX_DATA_CENTER_ID; // 取低位部分作為機(jī)器ID部分 this.workerId = workerId & MAX_WORKER_ID; } /** * 創(chuàng)建 ID 生成器的方式二: 使用工作機(jī)器 ID 和機(jī)房 ID,優(yōu)點(diǎn)是方便分機(jī)房管理 * * @param dataCenterId 機(jī)房 ID (0~31) * @param workerId 工作機(jī)器 ID (0~31) */ public SnowFlakeIdWorker(long dataCenterId, long workerId) { if (workerId > MAX_WORKER_ID || workerId < 0) { throw new IllegalArgumentException(String.format("Worker ID can't be greater than %d or less than 0", MAX_WORKER_ID)); } if (dataCenterId > MAX_DATA_CENTER_ID || dataCenterId < 0) { throw new IllegalArgumentException(String.format("DataCenter ID can't be greater than %d or less than 0", MAX_DATA_CENTER_ID)); } this.workerId = workerId; this.dataCenterId = dataCenterId; } /** * 獲得下一個(gè) ID(該方法是線程安全的) * * @return 返回一個(gè)長(zhǎng)度位15的 long類型的數(shù)字 */ public synchronized long nextId() { long timestamp = timeGen(); // 如果當(dāng)前時(shí)間小于上一次 ID 生成的時(shí)間戳,說(shuō)明發(fā)生時(shí)鐘回?fù)?,為保證ID不重復(fù)拋出異常。 if (timestamp < lastTimestamp) { throw new RuntimeException(String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp)); } if (lastTimestamp == timestamp) { // 同一時(shí)間生成的,則序號(hào)+1 sequence = (sequence + 1) & SEQUENCE_MASK; // 毫秒內(nèi)序列溢出:超過(guò)最大值 if (sequence == 0) { // 阻塞到下一個(gè)毫秒,獲得新的時(shí)間戳 timestamp = tilNextMillis(lastTimestamp); } } else { // 時(shí)間戳改變,毫秒內(nèi)序列重置 sequence = 0L; } // 上次生成 ID 的時(shí)間戳 lastTimestamp = timestamp; // 移位并通過(guò)或運(yùn)算拼到一起 return ((timestamp - TW_EPOCH) << TIMESTAMP_LEFT_SHIFT) | (dataCenterId << DATA_CENTER_ID_SHIFT) | (workerId << WORKER_ID_SHIFT) | sequence; } private long tilNextMillis(long lastTimestamp) { long timestamp = timeGen(); while (timestamp <= lastTimestamp) { timestamp = timeGen(); } return timestamp; } private long timeGen() { return System.currentTimeMillis(); } }
使用示例
// 初始化 SnowFlakeIdWorker idWorker = new SnowFlakeIdWorker(1, 0); // 生成ID for(int i=0; i<100; i++){ System.out.println(idWorker.nextId()); }
注意服務(wù)器不能發(fā)生時(shí)鐘回?fù)?,即系統(tǒng)時(shí)間發(fā)生錯(cuò)誤,因?yàn)檠┗ㄋ惴ㄊ腔跁r(shí)間來(lái)生成,所有當(dāng)發(fā)生時(shí)鐘回?fù)芎髸?huì)導(dǎo)致出現(xiàn)重復(fù)ID的問(wèn)題。
以上就是Java 基于雪花算法生成分布式id的詳細(xì)內(nèi)容,更多關(guān)于Java 雪花算法生成分布式id的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Java中如何對(duì)字符串進(jìn)行utf-8編碼
這篇文章主要介紹了Java中如何對(duì)字符串進(jìn)行utf-8編碼問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-04-04關(guān)于request.getRequestDispatcher().forward()的妙用及DispatcherType
這篇文章主要介紹了關(guān)于request.getRequestDispatcher().forward()的妙用及DispatcherType對(duì)Filter配置的影響,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-01-01springboot 自定義異常并捕獲異常返給前端的實(shí)現(xiàn)代碼
在開(kāi)發(fā)中,如果用try catch的方式,每個(gè)方法都需要單獨(dú)實(shí)現(xiàn),為了方便分類異常,返回給前端,采用了@ControllerAdvice注解和繼承了RuntimeException的方式來(lái)實(shí)現(xiàn),具體實(shí)現(xiàn)內(nèi)容跟隨小編一起看看吧2021-11-11SpringBoot RestTemplate請(qǐng)求日志打印方式
這篇文章主要介紹了SpringBoot RestTemplate請(qǐng)求日志打印方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-07-07被遺忘的Java關(guān)鍵字transient的使用詳解
在 Java 中,transient 是一個(gè)關(guān)鍵字,用于指定一個(gè)類的字段(成員變量)在序列化時(shí)應(yīng)該被忽略。本文將通過(guò)示例為大家簡(jiǎn)單講講transient的使用,需要的可以參考一下2023-04-04