学会听
这里我基于pytorch的speechbrain的预训练模型,训练得出一个中文语音识别系统, 可以实现中文语音转转化为文字输出。 1.基本的环境配置,后面的缺什么就 pip 什么- pip install speechbrain
- pip install SoundFile
- pip install sox
- pip install speech_recognition
复制代码 2.实现语音的接收并保存为wav文件这里基于speech_recognition包进行实现。 在读取语音等到没有语音输入时,自动停止并保存。 测试代码: - import speech_recognition as sr #pyaudio SpeechRecognition模块
-
- from myself_word_to_voice import speakout
-
- def rec(rate=16000): #从系统麦克风拾取音频数据,采样率为 16000
- r = sr.Recognizer()
- with sr.Microphone(sample_rate=rate) as source:
- sayword = 'coco在听呢'
- print(sayword) #这里会打印please say something,提示你说话进行录音
- audio = r.listen(source)
-
- with open("recording.wav", "wb") as f: #把采集到的音频数据以 wav 格式保存在当前目录下的recording.wav 文件
- f.write(audio.get_wav_data())
- print('您说的我已经收到了')
- return 1
-
- rec()
复制代码 测试结果:打开项目文件夹,直接双击打开recording.wav文件即可听到你说的话。
|