百度飞桨语音PaddleSpeech在win上运行语音识别(ASR)与语音合成(TTS)

前言

PaddleSpeech是PaddlePadle百度飞桨深度学习框架下的语音服务工具包。PaddleSpeech包括自监督学习模型、带标点符号的 SOTA/流式 ASR、带文本前端的流式 TTS、说话人验证系统、端到端语音翻译和关键字识别。

我在部署运行过程中,遇到很多问题,参考了很多资料,在这里做一个从安装部署到运行测试的、详尽的记录。

文章目录

文章目录

前言

先决条件

运行环境搭建

安装Anaconda

安装过程

查看conda版本

项目部署

为PaddleSpeech创建专属虚拟环境

安装 C++ 编译环境

安装PaddleSpeech

安装pytest-runner

安装paddlepaddle

安装paddlespeech

新建PaddleSpeech工作文件夹

快速上手

自动语音识别ASR(Automatic Speech Recognition)

准备测试音频

语音识别

运行报错及解决

重新识别

语音合成TTS(Text-to-Speech)(本文转语音)

语音合成

运行报错及解决

重新合成语音

关于日志

快速使用服务

启动服务

准备启动服务的配置文件

启动服务

访问语音识别服务

访问语音合成服务

设置PaddleSpeech服务开机自启

PaddleSpeech Server 接口Api介绍

引用

先决条件

官方给的要求如下

Python >= 3.7 (我这里使用Python3.9)

最新版本的 PaddlePaddle

C++ 编译环境 (win下,可通过Visual Studio Installer来安装)

提示: 我们建议在安装 paddlepaddle 的时候使用百度源 https://mirror.baidu.com/pypi/simple ,而在安装 paddlespeech 的时候使用清华源 https://pypi.tuna.tsinghua.edu.cn/simple 。

运行环境搭建

安装Anaconda

安装过程

安装步骤略过,参考文章:anaconda的安装和使用

查看conda版本

Anaconda Power Shell控制台中输入以下命令:

conda info

精彩内容

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: