快捷導(dǎo)航

python 并發(fā)編程多路復(fù)用IO模型詳解

更新時(shí)間：2019年08月20日 11:52:01 作者：minger_lcm

這篇文章主要介紹了python 并發(fā)編程多路復(fù)用IO模型詳解,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

多路復(fù)用IO(IO multiplexing)

這種IO方式為事件驅(qū)動IO(event driven IO)。

我們都知道，select/epoll的好處就在于單個進(jìn)程process就可以同時(shí)處理多個網(wǎng)絡(luò)連接的IO。它的基本原理就是select/epoll這個function會不斷的輪詢所負(fù)責(zé)的所有socket，當(dāng)某個socket有數(shù)據(jù)到達(dá)了，就通知用戶進(jìn)程。它的流程如圖：

select是多路復(fù)用的一種

當(dāng)用戶進(jìn)程調(diào)用了select，那么整個進(jìn)程會被block，而同時(shí)，kernel會“監(jiān)視”所有select負(fù)責(zé)的socket，
當(dāng)任何一個socket中的數(shù)據(jù)準(zhǔn)備好了，select就會返回。這個時(shí)候用戶進(jìn)程再調(diào)用read操作，將數(shù)據(jù)從kernel拷貝到用戶進(jìn)程。
這個圖和blocking IO的圖其實(shí)并沒有太大的不同，事實(shí)上還更差一些。因?yàn)檫@里需要使用兩個系統(tǒng)調(diào)用\(select和recvfrom\)，
而blocking IO只調(diào)用了一個系統(tǒng)調(diào)用\(recvfrom\)。但是，用select的優(yōu)勢在于它可以同時(shí)處理多個connection。

多路復(fù)用IO比較阻塞IO模型：

1.阻塞IO經(jīng)歷兩個階段 wait data，copy data

2.多路復(fù)用3個階段 wait data，ready copy data， copy data

單連接套接字通信阻塞IO效率高

多路復(fù)用IO select可以代理多個套接字連接，多個套接字通信，多路復(fù)用IO效率高

強(qiáng)調(diào)：

1. 如果處理的連接數(shù)不是很高的話，使用select/epoll的web server不一定比使用multi-threading + blocking IO的web server性能更好，可能延遲還更大。select/epoll的優(yōu)勢并不是對于單個連接能處理得更快，而是在于能處理更多的連接。

2. 在多路復(fù)用模型中，對于每一個socket，一般都設(shè)置成為non-blocking，但是，如上圖所示，整個用戶的process其實(shí)是一直被block的。只不過process是被select這個函數(shù)block，而不是被socket IO給block。

結(jié)論: select的優(yōu)勢在于可以處理多個連接，性能高，同時(shí)可以檢測多個套接字IO行為，不適用于單個連接

select網(wǎng)絡(luò)IO模型示例

select 檢測多個套接字IO行為 accept，recv

IO行為兩種：

1.別人給我傳數(shù)據(jù)

2.給別人發(fā)送數(shù)據(jù)

timeout是超時(shí)時(shí)間

每隔0.5秒去問操作系統(tǒng)準(zhǔn)備好數(shù)據(jù)沒有

def select(rlist, wlist, xlist, timeout=None): 
  pass
# [] 傳的空列表是出異常的列表
# 返回值3個列表 收列表，發(fā)列表，異常列表
rl,wl,xl = select.select(rlist, wlist, [], 0.5)

客戶端:

from socket import *
client = socket(AF_INET,SOCK_STREAM)
client.connect(('127.0.0.1',8000))
while True:
  msg = input(">>>:").strip()
  if not msg:continue
  client.send(msg.encode("utf-8"))
  data = client.recv(1024)
  print(data.decode("utf-8"))
client.close()

服務(wù)端代碼：

from socket import *
import select
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 設(shè)置socket接口為 非阻塞IO接口
# 默認(rèn)是True 為阻塞
server.setblocking(False)
# 專門存著收消息套接字
rlist = [server,]
# 存放發(fā)送消息套接字
wlist = []
# 存放發(fā)送的數(shù)據(jù)
wdata = {}
while True:
  # 返回值3個列表 收列表，發(fā)列表，異常列表
  rl,wl,xl = select.select(rlist, wlist, [], 0.5)
  print("rl",rl)
  print("wl",wl)
  for sock in rl:
    if sock == server:
      conn,addr = sock.accept()
      rlist.append(conn)
    else:
      try:
        data = sock.recv(1024)
        if not data:
          sock.close()
          rlist.remove(sock)
          continue
        # 收的套接字加到列表
        wlist.append(sock)
        # 把數(shù)據(jù)加到字典 做一個 套接字對應(yīng)數(shù)據(jù)
        wdata[sock] = data.upper()

      except Exception:
        sock.close()
        rlist.remove(sock)
  # 發(fā)送數(shù)據(jù)
  for sock in wl:
    sock.send(wdata[sock])
    wlist.remove(sock)
    wdata.pop(sock)
server.close()

基于select模塊檢測套接字IO行為，實(shí)現(xiàn)并發(fā)效果

select監(jiān)聽fd變化的過程分析：

用戶進(jìn)程創(chuàng)建socket對象，拷貝監(jiān)聽的fd到內(nèi)核空間，每一個fd會對應(yīng)一張系統(tǒng)文件表，內(nèi)核空間的fd響應(yīng)到數(shù)據(jù)后，
就會發(fā)送信號給用戶進(jìn)程數(shù)據(jù)已到；

用戶進(jìn)程再發(fā)送系統(tǒng)調(diào)用，比如（accept）將內(nèi)核空間的數(shù)據(jù)copy到用戶空間，同時(shí)作為接受數(shù)據(jù)端內(nèi)核空間的數(shù)據(jù)清除，
這樣重新監(jiān)聽時(shí)fd再有新的數(shù)據(jù)又可以響應(yīng)到了（發(fā)送端因?yàn)榛赥CP協(xié)議所以需要收到應(yīng)答后才會清除）。

該模型的優(yōu)點(diǎn)：

可以同時(shí)檢測多個套接字，效率比阻塞IO，非阻塞IO高了

相比其他模型，使用select() 的事件驅(qū)動模型只用單線程（進(jìn)程）執(zhí)行，占用資源少，不消耗太多 CPU，同時(shí)能夠?yàn)槎嗫蛻舳颂峁┓?wù)。

如果試圖建立一個簡單的事件驅(qū)動的服務(wù)器程序，這個模型有一定的參考價(jià)值。

該模型的缺點(diǎn)：

代理的套接字列表里的多個套接字，需要循環(huán)列表一個個檢測，

在代理套接字比較少的情況下，循環(huán)比較快。但select代理的套接字非常多的情況下，select隨著列表增大，效率就越來越慢

首先select()接口并不是實(shí)現(xiàn)“事件驅(qū)動”的最好選擇。因?yàn)楫?dāng)需要探測的句柄值較大時(shí)，select()接口本身需要消耗大量時(shí)間去輪詢各個句柄。

很多操作系統(tǒng)提供了更為高效的接口，如linux提供了epoll，BSD提供了kqueue，Solaris提供了/dev/poll，…。
如果需要實(shí)現(xiàn)更高效的服務(wù)器程序，類似epoll這樣的接口更被推薦。遺憾的是不同的操作系統(tǒng)特供的epoll接口有很大差異，
所以使用類似于epoll的接口實(shí)現(xiàn)具有較好跨平臺能力的服務(wù)器會比較困難。
其次，該模型將事件探測和事件響應(yīng)夾雜在一起，一旦事件響應(yīng)的執(zhí)行體龐大，則對整個模型是災(zāi)難性的。

epoll是異步方式實(shí)現(xiàn)，提交套接字時(shí)候，每個套接字身上都綁定一個回調(diào)函數(shù)，哪個套接字準(zhǔn)備好了，就觸發(fā)回調(diào)函數(shù)，把自己索引放在單獨(dú)列表里，對于select來說，只需要去準(zhǔn)備好的列表里根據(jù)索引拿到套接字，這樣不需要在列表里每個遍歷。

epoll不支持windows系統(tǒng)

以上就是本文的全部內(nèi)容，希望對大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章: