一個簡單的語音識別實現
測試音頻
鏈接:http://pan.baidu.com/s/1o8Ue4B4 密碼:o5r1 ]
注意事項
音頻格式限制
pcm(不壓縮)、wav、amr採樣頻率及位數
支持評測 8k/16k 採樣率 16bit 位深的單聲道語音(這個採樣頻率支持確實不太友好,大部分手機和電腦錄音的現在都是44KHz了)
安裝SDK
可以直接pip安裝
pip install baidu-aip
接口調用
# 引入Speech SDKfrom aip import AipSpeechimport os path = 'D:/data/VoiceRecog/'os.chdir(path)# 定義常量APP_ID = '你的 App ID'API_KEY = '你的 API Key'SECRET_KEY = '你的 Secret Key'# 初始化AipSpeech對象aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 讀取文件def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read()# 識別本地文件#aipSpeech.asr(get_file_content('demo0.wav'), 'wav', 16000, {'lan': 'zh',})#遍歷文件夾中的wav竝進行識別for dir in [x for x in os.listdir(path) if x[-1]=='v']: print dir try: t = aipSpeech.asr(get_file_content(dir), 'wav', 16000, { 'lan': 'zh',}) #print t print t['result'][0] except: print 'error ,pass'
識別結果:
demo0.wav
沒有,你除了關心這個還關心過什麽人是肉長的,如果再這樣下去也沒有什麽意思了,
demo1.wav
18012345678,
demo2.wav
中美數控,
0條評論