基于python和深度学习实现本地离线智能语音控制终端（三）

Cryyen · 发表于 2024-4-24 14:17:35

学会听

这里我基于pytorch的speechbrain的预训练模型，训练得出一个中文语音识别系统，

可以实现中文语音转转化为文字输出。

1.基本的环境配置，后面的缺什么就 pip 什么

复制代码

2.实现语音的接收并保存为wav文件

这里基于speech_recognition包进行实现。

在读取语音等到没有语音输入时，自动停止并保存。

测试代码：

import speech_recognition as sr #pyaudio SpeechRecognition模块
from myself_word_to_voice import speakout
def rec(rate=16000): #从系统麦克风拾取音频数据，采样率为 16000
r = sr.Recognizer()
with sr.Microphone(sample_rate=rate) as source:
sayword = 'coco在听呢'
print(sayword) #这里会打印please say something，提示你说话进行录音
audio = r.listen(source)
with open("recording.wav", "wb") as f: #把采集到的音频数据以 wav 格式保存在当前目录下的recording.wav 文件
f.write(audio.get_wav_data())
print('您说的我已经收到了')
return 1
rec()

复制代码

测试结果：打开项目文件夹，直接双击打开recording.wav文件即可听到你说的话。

		自动登录	找回密码
密码			立即注册