新聞中心
這是構(gòu)建語音識(shí)別器的最重要步驟,因?yàn)樵趯⒄Z音信號(hào)轉(zhuǎn)換為頻域后,我們必須將其轉(zhuǎn)換為可用的特征向量形式。 可以為此使用不同的特征提取技術(shù),如 MFCC,PLP,PLP-RASTA 等。

創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),赤峰企業(yè)網(wǎng)站建設(shè),赤峰品牌網(wǎng)站建設(shè),網(wǎng)站定制,赤峰網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,赤峰網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競(jìng)爭(zhēng)力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿,時(shí)刻以成就客戶成長(zhǎng)自我,堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。
示例
在以下示例中,我們將使用 MFCC 技術(shù)逐步使用 Python 從信號(hào)中提取特征。
導(dǎo)入必要的軟件包,如下所示 -
import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc, logfbank現(xiàn)在,讀取存儲(chǔ)的音頻文件。 它會(huì)返回兩個(gè)值 - 采樣頻率和音頻信號(hào)。 提供存儲(chǔ)音頻文件的路徑。
frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")請(qǐng)注意,在此首先抽取15000個(gè)樣本進(jìn)行分析。
audio_signal = audio_signal[:15000]使用 MFCC 技術(shù)并執(zhí)行以下命令來提取 MFCC 特征 -
features_mfcc = mfcc(audio_signal, frequency_sampling)
Python現(xiàn)在,打印 MFCC 參數(shù),如下所示 -
print('\nMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])使用下面給出的命令繪制并可視化 MFCC 特征 -
features_mfcc = features_mfcc.T
plt.matshow(features_mfcc)
plt.title('MFCC')在這一步中,我們使用如下濾器組特征,提取過濾器組特征 -
filterbank_features = logfbank(audio_signal, frequency_sampling)現(xiàn)在,打印過濾器組參數(shù)。
print('\nFilter bank:\nNumber of windows =', filterbank_features.shape[0])
print('Length of each feature =', filterbank_features.shape[1])繪制并可視化過濾器組特征。
filterbank_features = filterbank_features.T
plt.matshow(filterbank_features)
plt.title('Filter bank')
plt.show()根據(jù)上述步驟,您可以觀察到以下輸出:圖1為 MFCC,圖2為過濾器組。
文章名稱:創(chuàng)新互聯(lián)AI教程:AI人工智能語音特征提取
當(dāng)前URL:http://m.5511xx.com/article/ccsjdog.html


咨詢
建站咨詢
