一文读懂PaddleSpeech中英混合语音识别技术（二）

Cryyen · 发表于 2024-4-24 15:10:59

PaddleSpeech语音识别技术介绍

除了中英文混合的Conformer U2模型以外，飞桨语音模型库PaddleSpeech中包含了多种语音识别模型，能力涵盖了声学模型、语言模型、解码器等多个环节，支持多种语言。目前PaddleSpeech已经支持的语音识别声学模型包括DeepSpeech2、Transfromer、Conformer U2/U2 ++，支持中文和英文的单语言识别以及中英文混合识别；支持CTC前束搜索（CTC Prefix Beam Search）、CTC贪心搜索（CTC Greedy Search）、注意力重打分(Attention Rescoring)等多种解码方式；支持 N-Gram语言模型、有监督多语言大模型Whisper、无监督预训练大模型wav2vec2；同时还支持服务一键部署，可以快速封装流式语音识别和非流式语音识别服务。通过PaddleSpeech提供的命令行工具CLI和Python接口可以快速体验上述功能。

通过PaddleSpeech精品项目合集，可以在线体验PaddleSpeech的优秀项目，上面更有PaddleSpeech核心开发者精心打造的《飞桨PaddleSpeech语音技术课程》，帮助开发者们快速入门。

项目传送门https://aistudio.baidu.com/proje ... ?contributionType=1

如果您想了解更多有关PaddleSpeech的内容，欢迎前往PaddleSpeech主页学习更多用法，Star 关注，获取PaddleSpeech最新资讯。

PaddleSpeech地址[color=rgba(var(--bs-link-color-rgb),var(--bs-link-opacity,1))]https://github.com/PaddlePaddle/PaddleSpeech

		自动登录	找回密码
密码			立即注册

一文读懂PaddleSpeech中英混合语音识别技术（二）

浏览过的版块