找回密码
 立即注册
查看: 494|回复: 0

基于python和深度学习实现本地离线智能语音控制终端(三)

[复制链接]

86

主题

0

回帖

894

积分

中级会员

积分
894
发表于 2024-4-24 14:17:35 | 显示全部楼层 |阅读模式
学会听

这里我基于pytorch的speechbrain的预训练模型,训练得出一个中文语音识别系统,

可以实现中文语音转转化为文字输出。

1.基本的环境配置,后面的缺什么就 pip 什么
  1. pip install speechbrain
  2. pip install SoundFile
  3. pip install sox
  4. pip install speech_recognition
复制代码
2.实现语音的接收并保存为wav文件

这里基于speech_recognition包进行实现。

在读取语音等到没有语音输入时,自动停止并保存。

测试代码:

  1. import speech_recognition as sr   #pyaudio SpeechRecognition模块

  2. from myself_word_to_voice import speakout

  3. def rec(rate=16000):     #从系统麦克风拾取音频数据,采样率为 16000
  4.     r = sr.Recognizer()
  5.     with sr.Microphone(sample_rate=rate) as source:
  6.         sayword = 'coco在听呢'
  7.         print(sayword)  #这里会打印please say something,提示你说话进行录音
  8.         audio = r.listen(source)

  9.     with open("recording.wav", "wb") as f:   #把采集到的音频数据以 wav 格式保存在当前目录下的recording.wav 文件
  10.         f.write(audio.get_wav_data())
  11.         print('您说的我已经收到了')
  12.     return 1

  13. rec()
复制代码
测试结果:打开项目文件夹,直接双击打开recording.wav文件即可听到你说的话。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|EnMaking

GMT+8, 2025-3-31 09:07 , Processed in 0.050526 second(s), 23 queries .

Powered by Qiqirobot

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表