百度飞桨语音PaddleSpeech在win上运行语音识别(ASR)与语音合成(TTS)
前言
PaddleSpeech是PaddlePadle百度飞桨深度学习框架下的语音服务工具包。PaddleSpeech包括自监督学习模型、带标点符号的 SOTA/流式 ASR、带文本前端的流式 TTS、说话人验证系统、端到端语音翻译和关键字识别。
我在部署运行过程中,遇到很多问题,参考了很多资料,在这里做一个从安装部署到运行测试的、详尽的记录。
文章目录
文章目录
前言
先决条件
运行环境搭建
安装Anaconda
安装过程
查看conda版本
项目部署
为PaddleSpeech创建专属虚拟环境
安装 C++ 编译环境
安装PaddleSpeech
安装pytest-runner
安装paddlepaddle
安装paddlespeech
新建PaddleSpeech工作文件夹
快速上手
自动语音识别ASR(Automatic Speech Recognition)
准备测试音频
语音识别
运行报错及解决
重新识别
语音合成TTS(Text-to-Speech)(本文转语音)
语音合成
运行报错及解决
重新合成语音
关于日志
快速使用服务
启动服务
准备启动服务的配置文件
启动服务
访问语音识别服务
访问语音合成服务
设置PaddleSpeech服务开机自启
PaddleSpeech Server 接口Api介绍
引用
先决条件
官方给的要求如下
Python >= 3.7 (我这里使用Python3.9)
最新版本的 PaddlePaddle
C++ 编译环境 (win下,可通过Visual Studio Installer来安装)
提示: 我们建议在安装 paddlepaddle 的时候使用百度源 https://mirror.baidu.com/pypi/simple ,而在安装 paddlespeech 的时候使用清华源 https://pypi.tuna.tsinghua.edu.cn/simple 。
运行环境搭建
安装Anaconda
安装过程
安装步骤略过,参考文章:anaconda的安装和使用
查看conda版本
Anaconda Power Shell控制台中输入以下命令:
conda info
精彩内容
发表评论