如何在Windows系统上使用CUDA运行MozillaTTS/CoquiTTS培训?
我有一台装有 Quadro P5000 显卡的机器,运行 Windows 10。我想在这个系统上训练 TTS 语音。我需要安装什么才能完成这项工作?
回答
这是要安装/执行的操作:
- 下载并安装适用于 Windows 的Python 3.8(不是3.9+)。在安装过程中,请确保您:
- 选择为所有用户安装它。
- 选择将 Python 添加到 PATH。
- 下载并安装 CUDA Toolkit 10.1(不是11.0+)。
- 下载“cuDNN v7.6.5(2019 年 11 月 5 日),用于 CUDA 10.1”(不是cuDNN v8+),解压,然后将
cuda文件夹内的内容复制到C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.1. - 下载最新的 64 位版本的 eSpeak NG(无版本限制 :-))。
- 下载适用于 Windows 的最新 64 位 Git 版本(无版本限制 :-))。
- 打开 PowerShell 提示到您要安装 Coqui TTS 的文件夹。
- 运行
git clone https://github.com/coqui-ai/TTS.git。 - 运行
cd TTS。 - 运行
python -m venv .。 - 运行
.Scriptspip install -e .。 - 运行以下命令(由于已知问题,这与您从PyTorch 网站获得的命令不同):
.Scriptspip install torch==1.8.0+cu101 torchvision==0.9.0+cu101 torchaudio===0.8.0 -f https://download.pytorch.org/whl/torch_stable.html
- 将以下内容放入
TTS文件夹中名为“test_cuda.py”的脚本中:
import torch
x = torch.rand(5, 3)
print(x)
print(torch.cuda.is_available())
- 通过运行脚本
.Scriptspython ./test_cuda.py并确认输出如下所示(第一部分应该只有随机数,但最后一行必须读取True;如果没有,则 CUDA 未正确安装):
tensor([[0.2141, 0.7808, 0.9298],
[0.3107, 0.8569, 0.9562],
[0.2878, 0.7515, 0.5547],
[0.5007, 0.6904, 0.4136],
[0.2443, 0.4158, 0.4245]])
True
- 将以下内容放入
TTS文件夹中名为“train.bat”的脚本中,然后根据您的配置文件对其进行自定义:
set PYTHONIOENCODING=UTF-8
set PYTHONLEGACYWINDOWSSTDIO=UTF-8
set PHONEMIZER_ESPEAK_PATH=C:/Program Files/eSpeak NG/espeak-ng.exe
.Scriptspython.exe ./TTS/bin/train_tacotron.py --config_path "C:/path/to/your/config.json"
- 通过
.train.bat.
如果您使用的模型与 Tacotron 不同,或者需要将其他参数传递到训练脚本中,请随时进一步自定义train.bat.
如果您刚开始进行 TTS 培训,请查看如何在 Ubuntu 20.04 上使用 Mozilla TTS 开始培训自定义语音模型?.
THE END
二维码