python 錄制系統(tǒng)聲音的示例

更新時間：2020年12月21日 11:58:23 作者：skyblue°sen

這篇文章主要介紹了python 錄制系統(tǒng)聲音的示例，幫助大家更好的理解和使用python，感興趣的朋友可以了解下

環(huán)境準(zhǔn)備

python

wave
pyaudio

wave 可以通過pip直接install，在安裝pyaudio時，通過正常的pip install 直接安裝一直處于報錯階段，后來想到可以通過輪子直接安裝。

在pypi提供的安裝包中有對應(yīng)的安裝包，注意，不僅僅是python2和python3的區(qū)別，python3的小版本也有點差別。可杯具的是，小主電腦里裝的是python3.8，后來想到還有一個網(wǎng)站可以安裝pythonlibs，找到對應(yīng)的版本后，下載下來。直接在文件所在目錄，或者在安裝中指定文件目錄中執(zhí)行安裝

pip install /c/Users/root/Downloads/PyAudio-0.2.11-cp38-cp38-win_amd64.whl

代碼和運行

def audio_record(out_file, rec_time):
  CHUNK = 1024
  FORMAT = pyaudio.paInt16 # 16bit編碼格式
  CHANNELS = 1 # 單聲道
  RATE = 16000 # 16000采樣頻率
  p = pyaudio.PyAudio()
  # 創(chuàng)建音頻流
  dev_idx = findInternalRecordingDevice(p)
  stream = p.open(format=FORMAT, # 音頻流wav格式
          channels=CHANNELS, # 單聲道
          rate=RATE, # 采樣率16000
          input=True,
          input_device_index=dev_idx, # 指定內(nèi)錄設(shè)備的id，可以不寫，使用win的默認(rèn)錄音設(shè)備
          frames_per_buffer=CHUNK)
  print("Start Recording...")
  frames = [] # 錄制的音頻流
  # 錄制音頻數(shù)據(jù)
  for i in range(0, int(RATE / CHUNK * rec_time)): # 控制錄音時間
    data = stream.read(CHUNK)
    frames.append(data)
  # 錄制完成
  stream.stop_stream()
  stream.close()
  p.terminate()
  print("Recording Done...")
  # 保存音頻文件
  wf = wave.open(out_file, 'wb')
  wf.setnchannels(CHANNELS)
  wf.setsampwidth(p.get_sample_size(FORMAT))
  wf.setframerate(RATE)
  wf.writeframes(b''.join(frames))
  wf.close()

在使用默認(rèn)錄音設(shè)備時，發(fā)現(xiàn)是話筒錄音，效果并不是太理想，所以就去查查能不能直接錄系統(tǒng)的聲音。

def findInternalRecordingDevice(p):
  # 要找查的設(shè)備名稱中的關(guān)鍵字
  target = '立體聲混音'
  # 逐一查找聲音設(shè)備
  for i in range(p.get_device_count()):
    devInfo = p.get_device_info_by_index(i)
    print(devInfo)
    if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
      # print('已找到內(nèi)錄設(shè)備,序號是 ',i)
      return i
  print('無法找到內(nèi)錄設(shè)備!')
  return -1

可以使用p.get_device_info_by_index()去查看系統(tǒng)有關(guān)聲音的設(shè)備，通過設(shè)置為立體聲混音就可以錄制系統(tǒng)聲音。

保存聲音

def save(fileName):
  # 創(chuàng)建pyAudio對象
  p = pyaudio.PyAudio()
  # 打開用于保存數(shù)據(jù)的文件
  wf = wave.open(fileName, 'wb')
  # 設(shè)置音頻參數(shù)
  wf.setnchannels(CHANNELS)
  wf.setsampwidth(p.get_sample_size(FORMAT))
  wf.setframerate(RATE)
  # 寫入數(shù)據(jù)
  wf.writeframes(b''.join(_frames))
  # 關(guān)閉文件
  wf.close()
  # 結(jié)束pyaudio
  p.terminate()

保存聲音是通過上述代碼進行保存，此處的_frames是個list，是通過每錄一個chunk（數(shù)據(jù)流塊），就把這一塊的數(shù)據(jù)添加進去

然后只需要重新創(chuàng)建PyAudio對象，把這個list轉(zhuǎn)為字節(jié)串保存到文件中就可以了

問題

上述一般可以錄到系統(tǒng)聲音，但在執(zhí)行的時候發(fā)現(xiàn)，并不能。

原因是：win的輸入設(shè)備中沒有配置立體聲混音

設(shè)置步驟：

在win的聲音調(diào)節(jié)出，右擊打開聲音設(shè)置
找到管理聲音設(shè)備
在輸入設(shè)備處啟用立體聲混音

就此，就完成了錄制系統(tǒng)聲音的需求

注意

上述操作，可以外放，可以插入3.5mm耳機，但系統(tǒng)靜音和tpye-c耳機插入的時候不能錄到聲音

完整代碼

import os
import pyaudio
import threading
import wave
import time
from datetime import datetime

# 需要系統(tǒng)打開立體聲混音

# 錄音類
class Recorder():
  def __init__(self, chunk=1024, channels=2, rate=44100):
    self.CHUNK = chunk
    self.FORMAT = pyaudio.paInt16
    self.CHANNELS = channels
    self.RATE = rate
    self._running = True
    self._frames = []

  # 獲取內(nèi)錄設(shè)備序號,在windows操作系統(tǒng)上測試通過，hostAPI = 0 表明是MME設(shè)備
  def findInternalRecordingDevice(self, p):
    # 要找查的設(shè)備名稱中的關(guān)鍵字
    target = '立體聲混音'
    # 逐一查找聲音設(shè)備
    for i in range(p.get_device_count()):
      devInfo = p.get_device_info_by_index(i)
      # print(devInfo)
      if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
        # print('已找到內(nèi)錄設(shè)備,序號是 ',i)
        return i
    print('無法找到內(nèi)錄設(shè)備!')
    return -1

  # 開始錄音，開啟一個新線程進行錄音操作
  def start(self):
    threading._start_new_thread(self.__record, ())

  # 執(zhí)行錄音的線程函數(shù)
  def __record(self):
    self._running = True
    self._frames = []

    p = pyaudio.PyAudio()
    # 查找內(nèi)錄設(shè)備
    dev_idx = self.findInternalRecordingDevice(p)
    if dev_idx < 0:
      return
    # 在打開輸入流時指定輸入設(shè)備
    stream = p.open(input_device_index=dev_idx,
            format=self.FORMAT,
            channels=self.CHANNELS,
            rate=self.RATE,
            input=True,
            frames_per_buffer=self.CHUNK)
    # 循環(huán)讀取輸入流
    while (self._running):
      data = stream.read(self.CHUNK)
      self._frames.append(data)

    # 停止讀取輸入流
    stream.stop_stream()
    # 關(guān)閉輸入流
    stream.close()
    # 結(jié)束pyaudio
    p.terminate()
    return

  # 停止錄音
  def stop(self):
    self._running = False

  # 保存到文件
  def save(self, fileName):
    # 創(chuàng)建pyAudio對象
    p = pyaudio.PyAudio()
    # 打開用于保存數(shù)據(jù)的文件
    wf = wave.open(fileName, 'wb')
    # 設(shè)置音頻參數(shù)
    wf.setnchannels(self.CHANNELS)
    wf.setsampwidth(p.get_sample_size(self.FORMAT))
    wf.setframerate(self.RATE)
    # 寫入數(shù)據(jù)
    wf.writeframes(b''.join(self._frames))
    # 關(guān)閉文件
    wf.close()
    # 結(jié)束pyaudio
    p.terminate()


if __name__ == "__main__":

  # 檢測當(dāng)前目錄下是否有record子目錄
  if not os.path.exists('record'):
    os.makedirs('record')

  print("\npython 錄音機 ....\n")
  print("提示：按 r 鍵并回車 開始錄音\n")

  i = input('請輸入操作碼:')
  if i == 'r':
    rec = Recorder()
    begin = time.time()

    print("\n開始錄音,按 s 鍵并回車 停止錄音，自動保存到 record 子目錄\n")
    rec.start()

    running = True
    while running:
      i = input("請輸入操作碼:")
      if i == 's':
        running = False
        print("錄音已停止")
        rec.stop()
        t = time.time() - begin
        print('錄音時間為%ds' % t)
        # 以當(dāng)前時間為關(guān)鍵字保存wav文件
        rec.save("record/rec_" + datetime.now().strftime("%Y-%m-%d_%H-%M-%S") + ".wav")

以上就是python 錄制系統(tǒng)聲音的示例的詳細內(nèi)容，更多關(guān)于python 錄制系統(tǒng)聲音的資料請關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章: