GPT-SoVITS Windows 配置与推理笔记(自用)
GPT-SoVITS Windows 配置与推理笔记(自用)
这是给自己留的备份,方便下次查。Windows 端配置和推理为主,代码为核心,直接干货。
环境准备
- 系统:Windows 10/11
- Python:3.9(别用别的版本,坑多)
- GPU(可选):NVIDIA + CUDA 11.8(没 GPU 也能跑,慢点)
- FFmpeg:解压后扔根目录(最新版自带,但建议手动确认)
下载与安装
Git 下载(可选):
git clone https://github.com/RVC-Boss/GPT-SoVITS.git
或者直接去 GPT-SoVITS 项目页,点“Code”按钮,选“Download ZIP”。解压到 D:\GPT-SoVITS(路径自己定)。
进去后双击 go-webui.bat,第一次跑会自动装依赖和下载模型。需要啥提前装好:
- Python 3.9:
python --version # 检查是不是 3.9.x
- FFmpeg(最新版 GPT-SoVITS 自带,但建议手动放一份):
下载后放D:\GPT-SoVITS,验证:ffmpeg -version
依赖安装(如果自动失败)
go-webui.bat 一般自动搞定,但要是卡住(比如网络问题),手动敲:
python -m venv venv
venv\Scripts\activate
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
PyTorch 按需装:
- GPU:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
(CUDA 版本不对就去 PyTorch 官网 找对应链接)
- CPU:
pip install torch torchvision torchaudio
检查:
python -c "import torch; print(torch.__version__); print(torch.cuda.is_available())"
运行 WebUI
双击 go-webui.bat,会弹地址:
http://127.0.0.1:9880
浏览器打开。界面分几个Tab,我只用推理:
- 模型选择:挑 GPT 和 SoVITS 权重
- 音频输入:初始音频
- 文本输入:想说的内容
- 生成按钮:点一下出结果
坑:推理界面,选完模型点“刷新”后,必须勾选 [开启TTS推理WebUI],不然不会跳到语音合成页面。
推理步骤
- 权重放好:
D:\GPT-SoVITS\GPT_weightsD:\GPT-SoVITS\SoVITS_weights
下载地址:【碧蓝档案】全学生AI音色模型(自己挑喜欢的角色)。
- 初始音频:3-10 秒 WAV,上传到 WebUI,音色全靠它。
- 输入文本:“测试一下”之类,选好权重,点生成,底下出音频。
- 文本太长:用“切分”功能,分段处理,不然容易崩。
注意
- 音色偏向初始音频,选清晰的,别含背景杂音。
- 想“唱歌”:用 UVR5(
tools/uvr5/下有)分解人声,每段推理再拼,效果更像原唱。 - 推理时间:GPU 快,CPU 得等几秒。
问题
- WebUI 打不开:端口
9880被占,编辑go-webui.bat,改成别的(比如9881)。 - 依赖装不上:换源,或确认 Python 是 3.9。
- 模型加载失败:检查权重路径和文件名,别多空格或中文。
补充
- 初始音频质量:录个干净的,别用手机随便录,杂音多效果差。
- 权重版本:B站那个碧蓝档案的模型可能更新,下载前看下评论确认兼容。
GPT-SoVITS Windows 配置与推理笔记(自用)的更多相关文章
- windows配置nginx实现负载均衡集群
windows配置nginx实现负载均衡集群2014-08-20 09:44:40 来源:www.abcde.cn 评论:0 点击:617 网上大部分关于nginx负载均衡集群的教程都是lin ...
- FAT16/32不等于ESP:windows安装程序无法将windows配置为在此计算机的硬件上运行
今天给公司电脑装系统,由于公司特殊需要,要给新电脑装win7系统.三台完全一样的华硕adol笔记本,前两台都和win10并存装成了双系统,第三台被不懂系统的人尝试装win7搞坏了,只能全盘格式化后再装 ...
- C++Windows核心编程读书笔记
转自:http://www.makaidong.com/%E5%8D%9A%E5%AE%A2%E5%9B%AD%E6%96%87/71405.shtml "C++Windows核心编程读书笔 ...
- VS2010/2012配置优化记录笔记
VS2010/2012配置优化记录笔记 在某些情况下VS2010/2012运行真的实在是太卡了,有什么办法可以提高速度吗?下面介绍几个优化策略,感兴趣的朋友可以参考下,希望可以帮助到你 有的时候V ...
- Windows 安装程序无法将 Windows 配置为在此计算机的硬件上运行
遇到这个问题是用辅助工具(WinNTSetup3.exe)进行的安装,重启后就就遇到“Windows 安装程序无法将 Windows 配置为在此计算机的硬件上运行” 解决:在WIN PE 下挂载安装光 ...
- Windows phone 8 学习笔记(5) 图块与通知(转)
基于metro风格的Windows phone 8 应用提到了图块的概念,它就是指启动菜单中的快速启动图标.一般一个应用必须有一个默认图块,还可以有若干个次要图块.另外,通知与图块的关系比较密切,我们 ...
- Windows phone 8 学习笔记(2) 数据文件操作(转)
Windows phone 8 应用用于数据文件存储访问的位置仅仅限于安装文件夹.本地文件夹(独立存储空间).媒体库和SD卡四个地方.本节主要讲解它们的用法以及相关限制性.另外包括本地数据库的使用方式 ...
- Windows phone 8 学习笔记
Windows phone 8 学习笔记(1) 触控输入 http://www.apkbus.com/android-138547-1-1.html Windows phone 8 学习笔记(2) ...
- Windows phone 8 学习笔记(8) 定位地图导航
原文:Windows phone 8 学习笔记(8) 定位地图导航 Windows phone 8 已经不使用自家的bing地图,新地图控件可以指定制图模式.视图等.bing地图的定位误差比较大,在模 ...
- Windows phone 8 学习笔记(9) 集成
原文:Windows phone 8 学习笔记(9) 集成 本节整理了之前并没有提到的Windows phone 8 系统相关集成支持,包括选择器.锁定屏幕的.联系人的访问等.选择器列举了若干内置应用 ...
随机推荐
- MySQL存储引擎,锁,优化简述
今天主要分享常见的存储引擎:MyISAM.InnoDB.MERGE.MEMORY(HEAP).BDB(BerkeleyDB)等,以及最常用的MyISAM与InnoDB两个引擎 ,文章尾部有两者的详细比 ...
- 【java提高】---细则(3)
HashSet 与TreeSet和LinkedHashSet的区别 今天项目开发,需要通过两个条件去查询数据库数据,同时只要满足一个条件就可以取出这个对象.所以通过取出的数据肯定会有重复,所以要去掉重 ...
- XReport通过数据控制控件是否打印
需求场景:医嘱单在患者出院的时候,需要标记一条红线,表示以下没有医嘱了.数据库中此记录的一个字段属性isRed值来标记这一行. 实现:XReport报表的明细区域增加一个line1对象.然后在明细表格 ...
- H5调用手机拨打电话的功能
里面加上: 我没有写也是可以的 <meta name="format-detection" content="telephone=yes"/> 该标 ...
- Python 与 PostgreSQL 集成:深入 psycopg2 的应用与实践
title: Python 与 PostgreSQL 集成:深入 psycopg2 的应用与实践 date: 2025/2/4 updated: 2025/2/4 author: cmdragon e ...
- 云主机 vs 轻量型云主机:性能与灵活性的平衡
本文分享自天翼云开发者社区<云主机 vs 轻量型云主机:性能与灵活性的平衡>,作者:冯****芙 什么是轻量型云主机.什么是云主机? 云主机是云计算的一种基础设施服务模型,它是在云平台上通 ...
- IPv6的优势分析
本文分享自天翼云开发者社区<IPv6的优势分析>,作者:没烦恼 IPv6的优势分析 1.更大的地址空间 IPv6中IP地址的长度为128位,其地址容量则达到了2^128个,远远大于IPv4 ...
- Jenkins使用maven打包项目
Jenkins使用maven打包项目 作为一名软件测试工程师,在日常工作中,我们经常需要使用Jenkins进行持续集成和持续部署(CI/CD).而Maven作为Java项目的构建工具,更是不可或缺.今 ...
- Flink名词介绍
一.常用名词 1.Slot:处理槽,一般为服务器核数*4,平分服务器内存 2.Window:时间窗口 滚动窗口(Tumbling Window)将事件拆分成固定长度,窗口之间不重叠,窗口长度固定 例: ...
- Luogu P10842 Piggy and Trees 题解 [ 绿 ] [ 拆边 ] [ 贡献思维 ] [ 组合数学 ]
Piggy and Trees:把路径拆成边的思维题. 思路 一看到这题的路径,就想到了 Luogu P3177 树上染色 这题化路径为边的贡献,分别计算的思维. 那么对于此题,先来观察题目里式子的意 ...