百度飞桨语音PaddleSpeech在win上运行语音识别(ASR)与语音合成(TTS)

开发者是什么意思人工智能 2024-02-07 13 0

前言

PaddleSpeech是PaddlePadle百度飞桨深度学习框架下的语音服务工具包。PaddleSpeech包括自监督学习模型、带标点符号的 SOTA/流式 ASR、带文本前端的流式 TTS、说话人验证系统、端到端语音翻译和关键字识别。

我在部署运行过程中，遇到很多问题，参考了很多资料，在这里做一个从安装部署到运行测试的、详尽的记录。

文章目录

前言

先决条件

运行环境搭建

安装Anaconda

安装过程

查看conda版本

项目部署

为PaddleSpeech创建专属虚拟环境

安装 C++ 编译环境

安装PaddleSpeech

安装pytest-runner

安装paddlepaddle

安装paddlespeech

新建PaddleSpeech工作文件夹

快速上手

自动语音识别ASR(Automatic Speech Recognition)

准备测试音频

语音识别

运行报错及解决

重新识别

语音合成TTS(Text-to-Speech)(本文转语音)

语音合成

运行报错及解决

重新合成语音

关于日志

快速使用服务

启动服务

准备启动服务的配置文件

启动服务

访问语音识别服务

访问语音合成服务

设置PaddleSpeech服务开机自启

PaddleSpeech Server 接口Api介绍

引用

先决条件

官方给的要求如下

Python >= 3.7 (我这里使用Python3.9)

最新版本的 PaddlePaddle

C++ 编译环境 (win下，可通过Visual Studio Installer来安装)

提示: 我们建议在安装 paddlepaddle 的时候使用百度源 https://mirror.baidu.com/pypi/simple ，而在安装 paddlespeech 的时候使用清华源 https://pypi.tuna.tsinghua.edu.cn/simple 。

运行环境搭建

安装Anaconda

安装过程

安装步骤略过，参考文章：anaconda的安装和使用

查看conda版本

Anaconda Power Shell控制台中输入以下命令：

conda info

精彩内容

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

语音识别语音合成 ASR tts 百度飞桨语音

本文由用户于 2024-02-07 发布在金钥匙，如有疑问，请联系我们。
本文链接：https://www.51969.com/post/18505964.html

金钥匙

百度飞桨语音PaddleSpeech在win上运行语音识别(ASR)与语音合成(TTS)

华为 HarmonyOS：NativeWindow 开发指导

人工智能自然语言处理的新波：从语音识别到聊天机器人

发表评论取消回复

金钥匙

百度飞桨语音PaddleSpeech在win上运行语音识别(ASR)与语音合成(TTS)

华为 HarmonyOS：NativeWindow 开发指导

人工智能 自然语言处理的新波：从语音识别到聊天机器人

相关文章

发表评论取消回复

人工智能自然语言处理的新波：从语音识别到聊天机器人