如何通過雪花算法用Python實現(xiàn)一個簡單的發(fā)號器
實現(xiàn)一個簡單的發(fā)號器
根據snowflake算法的原理實現(xiàn)一個簡單的發(fā)號器,產生不重復、自增的id。
1.snowflake算法的簡單描述

這里的snowflake算法是用二進制的,有64位。其中41位的時間戳表示:當前時間戳減去某個設定的起始時間,10位標識表示:不同的機器、數據庫的標識ID等等,序列號為每秒或每毫秒內自增的id。
我做的時候沒有用位運算去實現(xiàn),而是做了一個十進制的,16位的(當時項目要求是16位的)。但是實現(xiàn)發(fā)號器的基本策略是一樣的,通過時間戳和標識來防止重復,通過序列號實現(xiàn)自增。當然啦,重點不是發(fā)號器多少位,而是根據項目的實際情況,利用snowflake算法的原理,實現(xiàn)一個適合自己項目的發(fā)號器。
2.Python實現(xiàn)
時間戳:9位,起始時間為2018-01-01 00:00:00 ,時間戳為當前時間減去起始時間。時間戳有9為,可用時間為 999999999/(606024*365)≈31(年)。
標識ID:2位,我用的時候比較簡單,只是涉及一個數據庫的情況,所以用一張數據表對應一個標識ID,可用100張表。
序列號:5位,我時間戳用的是秒級的,但是5位是10萬個序列號,經過測試在一秒內是完全夠用的。
所以時間戳、標識ID、序列號的位數也沒規(guī)定說一定要多少,根據自己項目的實際來即可。
代碼如下:
import time
class MySnow:
def __init__(self,dataID):
self.start = int(time.mktime(time.strptime('2018-01-01 00:00:00', "%Y-%m-%d %H:%M:%S")))
self.last = int(time.time())
self.countID = 0
self.dataID = dataID # 數據ID,這個自定義或是映射
def get_id(self):
# 時間差部分
now = int(time.time())
temp = now-self.start
if len(str(temp)) < 9: # 時間差不夠9位的在前面補0
length = len(str(temp))
s = "0" * (9-length)
temp = s + str(temp)
if now == self.last:
self.countID += 1 # 同一時間差,序列號自增
else:
self.countID = 0 # 不同時間差,序列號重新置為0
self.last = now
# 標識ID部分
if len(str(self.dataID)) < 2:
length = len(str(self.dataID))
s = "0" * (2-length)
self.dataID = s + str(self.dataID)
# 自增序列號部分
if self.countID == 99999: # 序列號自增5位滿了,睡眠一秒鐘
time.sleep(1)
countIDdata = str(self.countID)
if len(countIDdata) < 5: # 序列號不夠5位的在前面補0
length = len(countIDdata)
s = "0"*(5-length)
countIDdata = s + countIDdata
id = str(temp) + str(self.dataID) + countIDdata
return id
使用方法:
snow = MySnow(dataID="00") print(snow.get_id())
其中dataID即為標識ID,countID為自增序列號。dataID可以一個通過自定義的映射表獲得,這個視實際的項目情況而定。
3.關于并發(fā)
首先,直接用這個發(fā)號器是不能進行并發(fā)操作,會產生重復的id。如果真的要進行并發(fā),那么就要權衡一下并發(fā)和位數的哪個更重要了!
拿實際例子來說吧,比如我并發(fā)的目的是為了節(jié)省時間,讓程序更快的跑完,這時候為了并發(fā),我把dataID中拿出一位來,標識不同的子進程,這樣可以防止產生重復的id。但是實際上這用了位數去換取時間,如果是id位數比較少的情況,比如16位的,dataID比較少,我個人認為這樣是不值得的,有些奢侈。這時候便是位數比并發(fā)重要啦。
當時如果位數充裕,比如20位的,需要并發(fā)就并發(fā)啦。
還有一種實現(xiàn)并發(fā)的方法,就是給發(fā)號器加鎖,發(fā)號的時候加鎖,發(fā)完了解鎖。這個我沒有試過,有興趣的可以試一下哈哈。但是我有個疑惑啊,就是不斷加鎖和解鎖切換,帶來的時間和資源開銷會不會很大呢。
相關文章
pytorch中permute()函數用法補充說明(矩陣維度變化過程)
這篇文章主要給大家介紹了關于pytorch中permute()函數用法補充說明的相關資料,本文詳細說明了permute函數里維度變化的詳細過程,需要的朋友可以參考下2022-04-04
Python中出現(xiàn)"No?module?named?'requests'"
這篇文章主要給大家介紹了關于Python中出現(xiàn)"No?module?named?'requests'"的解決辦法,"No?module?named?requests"是Python報錯提示,意味著你在使用某個Python程序或腳本時,沒有找到名為requests的模塊,需要的朋友可以參考下2023-11-11

