GPT-SoVITS Windows 配置与推理笔记(自用)

这是给自己留的备份,方便下次查。Windows 端配置和推理为主,代码为核心,直接干货。

环境准备

  • 系统:Windows 10/11
  • Python:3.9(别用别的版本,坑多)
  • GPU(可选):NVIDIA + CUDA 11.8(没 GPU 也能跑,慢点)
  • FFmpeg:解压后扔根目录(最新版自带,但建议手动确认)

下载与安装

Git 下载(可选):

git clone https://github.com/RVC-Boss/GPT-SoVITS.git

或者直接去 GPT-SoVITS 项目页,点“Code”按钮,选“Download ZIP”。解压到 D:\GPT-SoVITS(路径自己定)。

进去后双击 go-webui.bat,第一次跑会自动装依赖和下载模型。需要啥提前装好:

  • Python 3.9:
    python --version  # 检查是不是 3.9.x
  • FFmpeg(最新版 GPT-SoVITS 自带,但建议手动放一份):

    下载后放 D:\GPT-SoVITS,验证:
    ffmpeg -version

依赖安装(如果自动失败)

go-webui.bat 一般自动搞定,但要是卡住(比如网络问题),手动敲:

python -m venv venv
venv\Scripts\activate
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

PyTorch 按需装:

  • GPU:
    pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

    (CUDA 版本不对就去 PyTorch 官网 找对应链接)

  • CPU:
    pip install torch torchvision torchaudio

检查:

python -c "import torch; print(torch.__version__); print(torch.cuda.is_available())"

运行 WebUI

双击 go-webui.bat,会弹地址:

http://127.0.0.1:9880

浏览器打开。界面分几个Tab,我只用推理:

  • 模型选择:挑 GPT 和 SoVITS 权重
  • 音频输入:初始音频
  • 文本输入:想说的内容
  • 生成按钮:点一下出结果

:推理界面,选完模型点“刷新”后,必须勾选 [开启TTS推理WebUI],不然不会跳到语音合成页面。

推理步骤

  1. 权重放好:

  2. 初始音频:3-10 秒 WAV,上传到 WebUI,音色全靠它。
  3. 输入文本:“测试一下”之类,选好权重,点生成,底下出音频。
  4. 文本太长:用“切分”功能,分段处理,不然容易崩。

注意

  • 音色偏向初始音频,选清晰的,别含背景杂音。
  • 想“唱歌”:用 UVR5(tools/uvr5/ 下有)分解人声,每段推理再拼,效果更像原唱。
  • 推理时间:GPU 快,CPU 得等几秒。

问题

  • WebUI 打不开:端口 9880 被占,编辑 go-webui.bat,改成别的(比如 9881)。
  • 依赖装不上:换源,或确认 Python 是 3.9。
  • 模型加载失败:检查权重路径和文件名,别多空格或中文。

补充

  • 初始音频质量:录个干净的,别用手机随便录,杂音多效果差。
  • 权重版本:B站那个碧蓝档案的模型可能更新,下载前看下评论确认兼容。

GPT-SoVITS Windows 配置与推理笔记(自用)的更多相关文章

  1. windows配置nginx实现负载均衡集群

    windows配置nginx实现负载均衡集群2014-08-20 09:44:40   来源:www.abcde.cn   评论:0 点击:617 网上大部分关于nginx负载均衡集群的教程都是lin ...

  2. FAT16/32不等于ESP:windows安装程序无法将windows配置为在此计算机的硬件上运行

    今天给公司电脑装系统,由于公司特殊需要,要给新电脑装win7系统.三台完全一样的华硕adol笔记本,前两台都和win10并存装成了双系统,第三台被不懂系统的人尝试装win7搞坏了,只能全盘格式化后再装 ...

  3. C++Windows核心编程读书笔记

    转自:http://www.makaidong.com/%E5%8D%9A%E5%AE%A2%E5%9B%AD%E6%96%87/71405.shtml "C++Windows核心编程读书笔 ...

  4. VS2010/2012配置优化记录笔记

    VS2010/2012配置优化记录笔记 在某些情况下VS2010/2012运行真的实在是太卡了,有什么办法可以提高速度吗?下面介绍几个优化策略,感兴趣的朋友可以参考下,希望可以帮助到你   有的时候V ...

  5. Windows 安装程序无法将 Windows 配置为在此计算机的硬件上运行

    遇到这个问题是用辅助工具(WinNTSetup3.exe)进行的安装,重启后就就遇到“Windows 安装程序无法将 Windows 配置为在此计算机的硬件上运行” 解决:在WIN PE 下挂载安装光 ...

  6. Windows phone 8 学习笔记(5) 图块与通知(转)

    基于metro风格的Windows phone 8 应用提到了图块的概念,它就是指启动菜单中的快速启动图标.一般一个应用必须有一个默认图块,还可以有若干个次要图块.另外,通知与图块的关系比较密切,我们 ...

  7. Windows phone 8 学习笔记(2) 数据文件操作(转)

    Windows phone 8 应用用于数据文件存储访问的位置仅仅限于安装文件夹.本地文件夹(独立存储空间).媒体库和SD卡四个地方.本节主要讲解它们的用法以及相关限制性.另外包括本地数据库的使用方式 ...

  8. Windows phone 8 学习笔记

    Windows phone 8 学习笔记(1) 触控输入  http://www.apkbus.com/android-138547-1-1.html Windows phone 8 学习笔记(2) ...

  9. Windows phone 8 学习笔记(8) 定位地图导航

    原文:Windows phone 8 学习笔记(8) 定位地图导航 Windows phone 8 已经不使用自家的bing地图,新地图控件可以指定制图模式.视图等.bing地图的定位误差比较大,在模 ...

  10. Windows phone 8 学习笔记(9) 集成

    原文:Windows phone 8 学习笔记(9) 集成 本节整理了之前并没有提到的Windows phone 8 系统相关集成支持,包括选择器.锁定屏幕的.联系人的访问等.选择器列举了若干内置应用 ...

随机推荐

  1. ForkJoin全解1:简单使用与大致实现原理

    1. 使用示例import java.lang.reflect.Method; import java.util.concurrent.ForkJoinPool;import java.util.co ...

  2. 2025 最佳免费商用文本转语音模型: Kokoro TTS

    在文本转语音(TTS)技术领域,一项突破性的进展引起了广泛关注--Kokoro TTS 模型凭借其卓越性能和完全免费的商用许可,成为目前最出色的 TTS 解决方案之一.基于广受欢迎的开源框架 Styl ...

  3. $router.options.routes取不到全部路由

    最近在看老项目的路由逻辑 项目使用constantRoutes和asyncRoutes分别代表基本路由和动态路由.createRouter时,传入的routes参数只有基本路由 在路由导航守卫中,判断 ...

  4. Mac安装NTL库

    Mac安装NTL库 NTL是一个高性能.可移植的C++库,为任意长度的整数提供数据结构和算法:用于整数和有限域上的向量.矩阵和多项式:以及任意精度的浮点运算. 具有以下功能: 任意长度整数运算和任意精 ...

  5. 镜像分层复用与Dockerfile

  6. Linux基础命令3:通过名称指定文件、创建文件目录

    描述Linux文件系统层次结构概念 /root(root的home目录)/home/username(其它普通用户的home目录)/bin, /usr/bin, /usr/local/bin命令存放处 ...

  7. .NET最佳实践:避免滥用Task.Run

    在 C# 中,Task.Run 是用来在后台线程中执行异步任务的一个常见方法. 它非常适用于需要并行处理的场景,但如果不加以谨慎使用,可能会导致额外的线程池调度,进而影响程序的性能. 什么是线程池? ...

  8. FLink写入Clickhouse优化

    一.背景 ck因为有合并文件操作,适合批量写入.如单条插入则速度太慢 二.Flink写入ck优化 改为分批插入,代码如下 DataStream<Row> stream = ... stre ...

  9. 永久解决VSCode终端中文乱码问题

    方法如下: 在VSCode中通过打开"文件"--"首选项"--"设置", 然后在"setting.json"中 添加以下 ...

  10. [CF576E] Painting Edges 题解

    模版题的升级了. 使用二分图经典判定方法(一个点拆成两个点 \(x,x+n\),连边 \((x,y)\) 就是连接 \((x,y+n),(x+n,y)\),那么是否是二分图就等价于判断 \(x,x+n ...