一個簡單的語音識別實現

一個簡單的語音識別實現,第1張


測試音頻

鏈接:http://pan.baidu.com/s/1o8Ue4B4 密碼:o5r1 ]

注意事項

  • 音頻格式限制
    pcm(不壓縮)、wav、amr

  • 採樣頻率及位數
    支持評測 8k/16k 採樣率 16bit 位深的單聲道語音(這個採樣頻率支持確實不太友好,大部分手機和電腦錄音的現在都是44KHz了)

安裝SDK

可以直接pip安裝

pip install baidu-aip

接口調用

# 引入Speech SDKfrom aip import AipSpeechimport os
path = 'D:/data/VoiceRecog/'os.chdir(path)# 定義常量APP_ID = '你的 App ID'API_KEY = '你的 API Key'SECRET_KEY = '你的 Secret Key'# 初始化AipSpeech對象aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 讀取文件def get_file_content(filePath):
    with open(filePath, 'rb') as fp:        return fp.read()# 識別本地文件#aipSpeech.asr(get_file_content('demo0.wav'), 'wav', 16000, {'lan': 'zh',})#遍歷文件夾中的wav竝進行識別for dir in [x for x in os.listdir(path) if x[-1]=='v']:    print dir    try:
        t = aipSpeech.asr(get_file_content(dir), 'wav', 16000, { 'lan': 'zh',})        #print t
        print t['result'][0]    except:        print 'error ,pass'

識別結果:

demo0.wav
沒有,你除了關心這個還關心過什麽人是肉長的,如果再這樣下去也沒有什麽意思了,
demo1.wav
18012345678,
demo2.wav
中美數控,


生活常識_百科知識_各類知識大全»一個簡單的語音識別實現

0條評論

    發表評論

    提供最優質的資源集郃

    立即查看了解詳情