Python提取頻域特征知識點淺析
在多數(shù)的現(xiàn)代語音識別系統(tǒng)中,人們都會用到頻域特征。梅爾頻率倒譜系數(shù)(MFCC),首先計算信號的功率譜,然后用濾波器和離散余弦變換的變換來提取特征。本文重點介紹如何提取MFCC特征。
首先創(chuàng)建有一個Python文件,并導(dǎo)入庫文件: from scipy.io import wavfile from python_speech_features import mfcc, logfbank import matplotlib.pylab as plt1、首先創(chuàng)建有一個Python文件,并導(dǎo)入庫文件: from scipy.io import wavfile from python_speech_features import mfcc, logfbank import matplotlib.pylab as plt
讀取音頻文件:
samplimg_freq, audio = wavfile.read("data/input_freq.wav")
提取MFCC特征和過濾器特征:
mfcc_features = mfcc(audio, samplimg_freq)
filterbank_features = logfbank(audio, samplimg_freq)
打印參數(shù),查看可生成多少個窗體:
print('\nMFCC:\nNumber of windows =', mfcc_features.shape[0]) print('Length of each feature =', mfcc_features.shape[1]) print('\nFilter bank:\nNumber of windows=', filterbank_features.shape [0]) print('Length of each feature =', filterbank_features.shape[1])
將MFCC特征可視化。轉(zhuǎn)換矩陣,使得時域是水平的:
mfcc_features = mfcc_features.T plt.matshow(mfcc_features) plt.title('MFCC')
將濾波器組特征可視化。轉(zhuǎn)化矩陣,使得時域是水平的:
filterbank_features = filterbank_features.T plt.matshow(filterbank_features) plt.title('Filter bank') plt.show()
- python實現(xiàn)圖片處理和特征提取詳解
- python利用小波分析進(jìn)行特征提取的實例
- 使用python進(jìn)行文本預(yù)處理和提取特征的實例
- python實現(xiàn)LBP方法提取圖像紋理特征實現(xiàn)分類的步驟
- 使用python實現(xiàn)語音文件的特征提取方法
- Python實現(xiàn)的特征提取操作示例
- Python + OpenCV 實現(xiàn)LBP特征提取的示例代碼
- python多進(jìn)程讀圖提取特征存npy
- 基于MATLAB和Python實現(xiàn)MFCC特征參數(shù)提取
- python利用opencv實現(xiàn)SIFT特征提取與匹配
相關(guān)文章
Pandas.DataFrame重置Series的索引index(reset_index)
本文主要介紹了Pandas.DataFrame重置Series的索引index(reset_index),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02python多進(jìn)程實現(xiàn)文件下載傳輸功能
這篇文章主要為大家詳細(xì)介紹了python多進(jìn)程實現(xiàn)文件下載傳輸功能,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-07-07