# -*- coding: utf-8 -*-
"""
Spyder Editor
This is a temporary script file.
"""
import pyaudio
import wave
CHUNK=256#設(shè)置底緩存塊的大小為256
FORMAT=pyaudio.paInt16#設(shè)置采樣深度為16位
CHANNELS=2#設(shè)置聲道數(shù)為2
RATE=16000#設(shè)置采樣率16
RECORD_SECONDS=10#錄音時長為10s
p=pyaudio.PyAudio()#實例化一個對象
#打開聲卡
stream=p.open(format=FORMAT,
                  channels=CHANNELS,
                  rate=RATE,               
                  input=True,
                  frames_per_buffer=CHUNK)
#創(chuàng)建列表用來儲存采樣的音頻數(shù)據(jù)
record_buf=[]
print("***開始錄音：請在10s內(nèi)輸入語音***")
for i in range(0,int(RATE/CHUNK*RECORD_SECONDS)):
    data=stream.read(CHUNK)
    record_buf.append(data)
print("***錄音結(jié)束***")
wf=wave.open('audiol.wav','wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(record_buf))
wf.close()#寫完后關(guān)閉聲卡
stream.stop_stream()#停止聲卡
stream.close()#關(guān)閉聲卡
p.terminate()#終止pyaudio

先前我出現(xiàn)了一個錯誤：一直提示sample width not specified（采樣深度沒有被指定）

在我無數(shù)次檢查后發(fā)現(xiàn)出錯的地方是程序中sample少打了個字母'e'

最后在相應(yīng)的文件夾下會出現(xiàn)wav文件

Python音頻操作工具pyaudio上手

當(dāng)需要使用Python處理音頻數(shù)據(jù)時，使用Python讀取與播放聲音必不可少，下面介紹一個好用的處理音頻PyAudio工具包。

PyAudio是Python開源工具包，由名思義，是提供對語音操作的工具包。提供錄音播放處理等功能，可以視作語音領(lǐng)域的OpenCV。

來看示例

1、采集音頻

下面以一段代碼演示如何從計算機麥克風(fēng)采集一段音頻，采集音頻時長 4s，保存文件 output.wav。

使用了tqdm模塊，可以方便顯示出來讀取過程：

import pyaudio
import wave
from tqdm import tqdm
def record_audio(wave_out_path,record_second):
	  FORMAT = pyaudio.paInt16#音頻數(shù)據(jù)格式
	  CHANNELS = 2#聲道數(shù)
	  RATE = 44100#采樣率
	  CHUNK = 1024#每次讀多少個數(shù)據(jù)
	  p = pyaudio.PyAudio()
	  stream = p.open(format=FORMAT,
	          		  channels=CHANNELS,
			          rate=RATE,
			          input=True,
			          frames_per_buffer=CHUNK)
	  wf = wave.open(wave_out_path, 'wb')
	  wf.setnchannels(CHANNELS)
	  wf.setsampwidth(p.get_sample_size(FORMAT))#其實就是2,表示兩個字節(jié)
	  wf.setframerate(RATE)
	  print("* recording")
	  ## RATE / CHUNK * record_second意思是：
	  ## 采樣率是RATE，每秒采集RATE個數(shù)據(jù)，所以每秒的音頻需要讀取RATE / CHUNK次
	  for i in tqdm(range(0, int(RATE / CHUNK * record_second))):
		    data = stream.read(CHUNK)
		    wf.writeframes(data)
	  print("* done recording")
	  stream.stop_stream()
	  stream.close()
	  p.terminate()
	  wf.close()
record_audio("output.wav",record_second=4)

2、播放音頻

下面使用播放的功能來播放1中保存的音頻 output.wav，通過tqdm，顯示播放進度條：

"""PyAudio Example: Play a WAVE file."""
import pyaudio
import wave
from tqdm import tqdm
def play_audio(wave_path):
	  CHUNK = 1024
	  wf = wave.open(wave_path, 'rb')
	  # instantiate PyAudio (1)
	  p = pyaudio.PyAudio()
	  # open stream (2)
	  stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
	          		  channels=wf.getnchannels(),
			          rate=wf.getframerate(),
			          output=True)
	  # read data
	  data = wf.readframes(CHUNK)
	  # play stream (3)
	  datas = []
	  while len(data) > 0:
		    data = wf.readframes(CHUNK)
		    datas.append(data)
	  for d in tqdm(datas):
	    	stream.write(d)
	  # stop stream (4)
	  stream.stop_stream()
	  stream.close()
	  # close PyAudio (5)
	  p.terminate()
play_audio("output.wav")