2026年,当我想尝试部署 GPT-Sovits 时,我发现并没有了当年的一帆风顺,而是直接报错不断——按照官方的部署指南和配置基本上100%无法启动程序。
这主要是依赖的库更新了,而部署的文档没有进行相应的更细,仓库没有更细导致的问题。解决这个问题花了我不少时间,现在也算是踩坑记录了。
环境准备
部署使用Conda虚拟环境部署,Python版本为3.10,使用Git克隆最新仓库(2026年6月16日,后续如果按照教程搞不定可以用Git回退到这个时间点前后)。
首先是克隆项目:
git clone https://github.com/RVC-Boss/GPT-SoVITS.git创建虚拟环境:
conda create -n GPTSoVits python=3.10 -y创建完成后,激活虚拟环境:
conda activate GPTSoVits按照第一个Python库:
pip install -r extra-req.txt --no-deps重点来了,如果你真的按照官方指南安装requirements.txt的库,100%报错,请使用下面这个指定库版本的requirements.txt:
--no-binary=opencc
numpy==1.26.4
scipy==1.15.3
tensorboard==2.20.0
librosa==0.10.2
numba==0.65.1
pytorch-lightning==2.6.5
gradio==4.44.1
ffmpeg-python==0.2.0
onnxruntime; platform_machine == "aarch64" or platform_machine == "arm64" #
onnxruntime-gpu==1.23.2; platform_machine == "x86_64" or platform_machine == "AMD64"
tqdm==4.68.2
funasr==1.0.27
cn2an==0.5.24
pypinyin==0.55.0
pyopenjtalk==0.4.1
g2p-en==2.1.0
torchaudio==2.11.0
modelscope==1.37.1
sentencepiece==0.2.1
transformers==4.50.0
peft==0.17.1
chardet==7.4.3
PyYAML==6.0.3
psutil==7.2.2
jieba_fast==0.53
jieba==0.42.1
split-lang==2.1.1
fast-langdetect==1.0.1
wordsegment==1.3.1
rotary-embedding-torch==0.8.9
ToJyutping==3.2.0
g2pk2==0.0.3
ko-pron==1.3
OpenCC==1.3.1
python-mecab-ko==1.3.7; sys_platform != 'win32'
fastapi==0.110.3
x-transformers==2.20.1
torchmetrics==1.5.0
pydantic==2.10.6
ctranslate2==4.8.0
av==17.1.0
Jinja2==3.1.3
starlette==0.37.2
torchcodec==0.14.0
huggingface-hub==0.26.0安装CUDA12依赖:
conda install -c nvidia cuda-toolkit=12.1 -y下载模型
进入项目文件夹,运行:
huggingface-cli download --resume-download lj1995/GPT-SoVITS --local-dir GPT_SoVITS/pretrained_models运行前记得开启魔法上网环境。
解决报错
当尝试在推理输入多种语言混合合成报错,则要下载 NLTK 英文扩展包:
python -c "import nltk; nltk.download('averaged_perceptron_tagger_eng'); nltk.download('averaged_perceptron_tagger'); nltk.download('cmudict')"当使用语音识别工具时报错:RuntimeError: Library libcublas.so.12 is not found or cannot be loaded
说明缺少 NVIDIA 核心计算库文件,使用下面的命令安装:
pip install nvidia-cublas-cu12 nvidia-cudnn-cu12解决完成报错,就可以开始操作训练模型啦。