Bootstrap

coqui-ai TTS 初步使用

项目地址:https://github.com/coqui-ai/TTS

 

1. 创建一个新的conda环境,如果自己会管理python环境也可以用其他方法

克隆项目下来

pip install -r requirements.txt     # 安装依赖 

pip install coqui-tts  # 只要命令行工具的话

下载自己想要的模型 Release v0.6.1 models · coqui-ai/TTS · GitHub

import torch
from TTS.api import TTS


## Init TTS 初始化,传入模型和配置文件路径
device = "cuda" if torch.cuda.is_available() else "cpu"  # Get device
tts = TTS(model_path="你的路径/model_file.pth", 
          config_path="你的路径/config.json", 
          progress_bar=True).to(device)


tts.tts_to_file(text="人生就像一场马拉松", file_path="output.wav")

下载的文件解压出来一般有:config.json  model_file.pth  scale_stats.npy 这些文件,config.json里面的scale_path要改为解压出来的scale_stats.npy对应的文件路径

代码中的文件路径也要指定,当然你也可以放到~/.local/tts/models 这个是linux的默认路径,具体路径可以到site-package tts的源码中改。

执行python脚本后,音频文件输出到tts_to_file方法的file_path参数指定的名字,示例中是当前路径的output.wav

 

;