Update Documentation (#2436)
* docs(Changelog_CN): Reformat the Changlog_CN before 2024.08 * docs(README): Update Multi-Language README * docs(Changelog_CN): Separate links and content * docs(Changelog_CN): fix missing issue. * docs(Changelog_EN): Update Changelog_EN to date * docs(Changelog_EN): fix typo * docs(Changelog_JA): Update Changelog_JA to date * docs(Changelog_KO): Update Changelog_KO to date * docs(Changelog_TR): Update Changelog_TR to date * docs(i18n): Update Multi-Language i18n JSON
This commit is contained in:
@@ -1,322 +1,481 @@
|
||||
# 更新日志
|
||||
|
||||
## 20240121
|
||||
|
||||
1-config添加is_share, 诸如colab等场景可以将此改为True, 来使得webui映射到公网
|
||||
|
||||
2-WebUI添加英文系统英文翻译适配
|
||||
|
||||
3-cmd-asr自动判断是否已自带damo模型, 如不在默认目录上将从modelscope自带下载
|
||||
|
||||
4-[SoVITS训练报错ZeroDivisionError](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) 尝试修复(过滤长度0的样本等)
|
||||
|
||||
5-清理TEMP文件夹缓存音频等文件
|
||||
|
||||
6-大幅削弱合成音频包含参考音频结尾的问题
|
||||
|
||||
## 20240122
|
||||
|
||||
1-修复过短输出文件返回重复参考音频的问题.
|
||||
|
||||
2-经测试, 英文日文训练原生支持(日文训练需要根目录不含非英文等特殊字符).
|
||||
|
||||
3-音频路径检查.如果尝试读取输入错的路径报错路径不存在, 而非ffmpeg错误.
|
||||
|
||||
## 20240123
|
||||
|
||||
1-解决hubert提取nan导致SoVITS/GPT训练报错ZeroDivisionError的问题
|
||||
|
||||
2-支持推理界面快速切换模型
|
||||
|
||||
3-优化模型文件排序逻辑
|
||||
|
||||
4-中文分词使用jieba_fast代替jieba
|
||||
|
||||
## 20240126
|
||||
|
||||
1-支持输出文本中英混合、日英混合
|
||||
|
||||
2-输出可选切分模式
|
||||
|
||||
3-修复uvr5读取到目录自动跳出的问题
|
||||
|
||||
4-修复多个换行导致推理报错
|
||||
|
||||
5-去除推理界面大量冗余log
|
||||
|
||||
6-支持mac训练推理
|
||||
|
||||
7-自动识别不支持半精度的卡强制单精度.cpu推理下强制单精度.
|
||||
|
||||
## 20240128
|
||||
|
||||
1-修复数字转汉字念法问题
|
||||
|
||||
2-修复句首少量字容易吞字的问题
|
||||
|
||||
3-通过限制排除不合理的参考音频长度
|
||||
|
||||
4-修复GPT训练不保存ckpt的问题
|
||||
|
||||
5-完善Dockerfile的下载模型流程
|
||||
|
||||
## 20240129
|
||||
|
||||
1-16系等半精度训练有问题的显卡把训练配置改为单精度训练
|
||||
|
||||
2-测试更新可用的colab版本
|
||||
|
||||
3-修复git clone modelscope funasr仓库+老版本funasr导致接口不对齐报错的问题
|
||||
|
||||
|
||||
## 20240130
|
||||
|
||||
1-所有涉及路径的地方双引号自动去除,小白复制路径带双引号不会报错
|
||||
|
||||
2-修复中英文标点切割问题和句首句尾补标点的问题
|
||||
|
||||
3-增加按标点符号切分
|
||||
|
||||
## 20240201
|
||||
|
||||
1-修复uvr5读取格式错误导致分离失败的问题
|
||||
|
||||
2-支持中日英混合多种文本自动切分识别语种
|
||||
|
||||
## 20240202
|
||||
|
||||
1-修复asr路径尾缀带/保存文件名报错
|
||||
|
||||
2-引入paddlespeech的Normalizer https://github.com/RVC-Boss/GPT-SoVITS/pull/377 修复一些问题, 例如: xx.xx%(带百分号类), 元/吨 会读成 元吨 而不是元每吨,下划线不再会报错
|
||||
|
||||
## 20240207
|
||||
|
||||
1-修正语种传参混乱导致中文推理效果下降 https://github.com/RVC-Boss/GPT-SoVITS/issues/391
|
||||
|
||||
2-uvr5适配高版本librosa https://github.com/RVC-Boss/GPT-SoVITS/pull/403
|
||||
|
||||
3-[修复uvr5 inf everywhere报错的问题(is_half传参未转换bool导致恒定半精度推理, 16系显卡会inf)](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)
|
||||
|
||||
4-优化英文文本前端
|
||||
|
||||
5-修复gradio依赖
|
||||
|
||||
6-支持三连根目录留空自动读取.list全路径
|
||||
|
||||
7-集成faster whisper ASR日文英文
|
||||
|
||||
## 20240208
|
||||
|
||||
1-GPT训练卡死 (win10 1909) 和https://github.com/RVC-Boss/GPT-SoVITS/issues/232 (系统语言繁体) GPT训练报错, [尝试修复](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b).
|
||||
|
||||
## 20240212
|
||||
|
||||
1-faster whisper和funasr逻辑优化.faster whisper转镜像站下载, 规避huggingface连不上的问题.
|
||||
|
||||
2-DPO Loss实验性训练选项开启, 通过构造负样本训练缓解GPT重复漏字问题.推理界面公开几个推理参数. https://github.com/RVC-Boss/GPT-SoVITS/pull/457
|
||||
|
||||
## 20240214
|
||||
|
||||
1-训练支持中文实验名 (原来会报错)
|
||||
|
||||
2-DPO训练改为可勾选选项而非必须.如勾选batch size自动减半.修复推理界面新参数不传参的问题.
|
||||
|
||||
## 20240216
|
||||
|
||||
1-支持无参考文本输入
|
||||
|
||||
2-修复中文文本前端bug https://github.com/RVC-Boss/GPT-SoVITS/issues/475
|
||||
|
||||
## 20240221
|
||||
|
||||
1-数据处理添加语音降噪选项 (降噪为只剩16k采样率, 除非底噪很大先不急着用哦).
|
||||
|
||||
2-中文日文前端处理优化 https://github.com/RVC-Boss/GPT-SoVITS/pull/559 https://github.com/RVC-Boss/GPT-SoVITS/pull/556 https://github.com/RVC-Boss/GPT-SoVITS/pull/532 https://github.com/RVC-Boss/GPT-SoVITS/pull/507 https://github.com/RVC-Boss/GPT-SoVITS/pull/509
|
||||
|
||||
3-mac CPU推理更快因此把推理设备从mps改到CPU
|
||||
|
||||
4-colab修复不开启公网url
|
||||
|
||||
## 20240306
|
||||
|
||||
1-推理加速50% (RTX3090+pytorch2.2.1+cu11.8+win10+py39 tested) https://github.com/RVC-Boss/GPT-SoVITS/pull/672
|
||||
|
||||
2-如果用faster whisper非中文ASR不再需要先下中文funasr模型
|
||||
|
||||
3-修复uvr5去混响模型 是否混响 反的 https://github.com/RVC-Boss/GPT-SoVITS/pull/610
|
||||
|
||||
4-faster whisper如果无cuda可用自动cpu推理 https://github.com/RVC-Boss/GPT-SoVITS/pull/675
|
||||
|
||||
5-修改is_half的判断使在Mac上能正常CPU推理 https://github.com/RVC-Boss/GPT-SoVITS/pull/573
|
||||
|
||||
## 202403/202404/202405
|
||||
|
||||
2个重点
|
||||
|
||||
1-修复sovits训练未冻结vq的问题 (可能造成效果下降)
|
||||
|
||||
2-增加一个快速推理分支
|
||||
|
||||
以下都是小修补
|
||||
|
||||
1-修复无参考文本模式问题
|
||||
|
||||
2-优化中英文文本前端
|
||||
|
||||
3-api格式优化
|
||||
|
||||
4-cmd格式问题修复
|
||||
|
||||
5-训练数据处理阶段不支持的语言提示报错
|
||||
|
||||
6-nan自动转fp32阶段的hubert提取bug修复
|
||||
|
||||
## 20240610
|
||||
|
||||
小问题修复:
|
||||
|
||||
1-完善纯标点、多标点文本输入的判断逻辑 https://github.com/RVC-Boss/GPT-SoVITS/pull/1168 https://github.com/RVC-Boss/GPT-SoVITS/pull/1169
|
||||
|
||||
2-uvr5中的mdxnet去混响cmd格式修复, 兼容路径带空格 [#501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232)
|
||||
|
||||
3-s2训练进度条逻辑修复 https://github.com/RVC-Boss/GPT-SoVITS/pull/1159
|
||||
|
||||
大问题修复:
|
||||
|
||||
4-修复了webui的GPT中文微调没读到bert导致和推理不一致, 训练太多可能效果还会变差的问题.如果大量数据微调的建议重新微调模型得到质量优化 [#99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a)
|
||||
|
||||
## 20240706
|
||||
|
||||
小问题修复:
|
||||
|
||||
1-[修正CPU推理默认bs小数](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041)
|
||||
|
||||
2-修复降噪、asr中途遇到异常跳出所有需处理的音频文件的问题 https://github.com/RVC-Boss/GPT-SoVITS/pull/1258 https://github.com/RVC-Boss/GPT-SoVITS/pull/1265 https://github.com/RVC-Boss/GPT-SoVITS/pull/1267
|
||||
|
||||
3-修复按标点符号切分时小数会被切分 https://github.com/RVC-Boss/GPT-SoVITS/pull/1253
|
||||
|
||||
4-[多卡训练多进程保存逻辑修复](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca)
|
||||
|
||||
5-移除冗余my_utils https://github.com/RVC-Boss/GPT-SoVITS/pull/1251
|
||||
|
||||
重点:
|
||||
|
||||
6-倍速推理代码经过验证后推理效果和base完全一致, 合并进main.使用的代码: https://github.com/RVC-Boss/GPT-SoVITS/pull/672 .支持无参考文本模式也倍速.
|
||||
|
||||
后面会逐渐验证快速推理分支的推理改动的一致性
|
||||
|
||||
## 20240727
|
||||
|
||||
1-清理冗余i18n代码 https://github.com/RVC-Boss/GPT-SoVITS/pull/1298
|
||||
|
||||
2-修复用户打文件及路径在结尾添加/会导致命令行报错的问题 https://github.com/RVC-Boss/GPT-SoVITS/pull/1299
|
||||
|
||||
3-修复GPT训练的step计算逻辑 https://github.com/RVC-Boss/GPT-SoVITS/pull/756
|
||||
|
||||
重点:
|
||||
|
||||
4-[支持合成语速调节.支持冻结随机性只调节语速, ](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2)并将其更新到api.py上https://github.com/RVC-Boss/GPT-SoVITS/pull/1340
|
||||
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): 增加 BS-Roformer 人声伴奏分离模型支持.
|
||||
## 202401
|
||||
|
||||
- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108)
|
||||
- 内容: WebUI 增加英文系统英文翻译适配.
|
||||
- 类型: 文档
|
||||
- 提交: D3lik
|
||||
- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e)
|
||||
- 内容: 尝试修复 SoVITS 训练报错 ZeroDivisionError 的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss, Tybost
|
||||
- 关联: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)
|
||||
- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3)
|
||||
- 内容: 大幅削弱合成音频包含参考音频结尾的问题.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef)
|
||||
- 内容: `cmd-asr.py` 添加判断默认目录内是否存在模型, 如不存在则从 ModelScope 自动下载.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d)
|
||||
- 内容: `Config.py` 添加 `is_share` 参数, 如 Colab 等场景可以将此改为 `True` 将 WebUI 映射到公网.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f)
|
||||
- 内容: 清理 TEMP 文件夹内缓存, 音频等文件.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68)
|
||||
- 内容: 修复过短输出文件返回重复参考音频的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.22 经测试, 英文日文训练原生支持 (日文训练需要根目录不含非英文等特殊字符).
|
||||
- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124)
|
||||
- 内容: 音频路径检查. 如果尝试读取输入错的路径报错路径不存在, 而非 FFmpeg 错误.
|
||||
- 类型: 优化
|
||||
- 提交: xmimu
|
||||
- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1)
|
||||
- 内容: 解决 HuBERT 提取 NaN 导致 SoVITS/GPT 训练报错 ZeroDivisionError 的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50)
|
||||
- 内容: 中文分词使用 `jieba_fast` 代替 `jieba`.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc)
|
||||
- 内容: 优化模型文件排序逻辑.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f)
|
||||
- 内容: 支持推理界面快速切换模型.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b)
|
||||
- 内容: 去除推理界面大量冗余日志.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200)
|
||||
- 内容: 支持 MacOS MPS 训练推理.
|
||||
- 类型: 新功能
|
||||
- 提交: Lion-Wu
|
||||
- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b)
|
||||
- 内容: 修复 UVR5 读取到目录自动跳出的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204)
|
||||
- 内容: 支持输出文本中英混合, 日英混合.
|
||||
- 类型: 新功能
|
||||
- 提交: Kakaru Hayate
|
||||
- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7)
|
||||
- 内容: 输出可选切分模式.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180)
|
||||
- 内容: 修复多个换行导致推理报错.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b)
|
||||
- 内容: 自动识别不支持半精度的卡强制单精度, CPU 推理下强制单精度.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238)
|
||||
- 内容: 完善 Dockerfile 下载模型流程.
|
||||
- 类型: 修复
|
||||
- 提交: breakstring
|
||||
- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257)
|
||||
- 内容: 修复数字转汉字念法问题.
|
||||
- 类型: 修复
|
||||
- 提交: duliangang
|
||||
- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683)
|
||||
- 内容: 修复 GPT 训练不保存权重文件的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8)
|
||||
- 内容: 排除不合理的参考音频长度.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3)
|
||||
- 内容: 修复句首少量字容易吞字的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0)
|
||||
- 内容: 对于 16 系等半精度训练存在问题的显卡把训练配置改为单精度训练.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec)
|
||||
- 内容: 测试更新可用的 Colab 版本.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135)
|
||||
- 内容: 更新 FunASR 为 1.0 版本并修复接口不对齐导致的报错问题.
|
||||
- 类型: 修复
|
||||
- 提交: LauraGPT
|
||||
- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4)
|
||||
- 内容: 修复中文标点切割问题和句首句尾补标点的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2)
|
||||
- 内容: 增加按标点符号切分.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7)
|
||||
- 内容: 所有涉及路径的位置自动去除双引号, 解决复制路径带双引号时报错的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
|
||||
## 202402
|
||||
|
||||
- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6)
|
||||
- 内容: 修复 ASR 路径尾缀带有 `/` 时保存文件名报错的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7)
|
||||
- 内容: 修复 UVR5 读取格式错误导致分离失败的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7)
|
||||
- 内容: 支持中日英混合多种语言文本自动切分识别语种.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377)
|
||||
- 内容: 引入 PaddleSpeech 的文本规范化, 修复一些问题, 例如: xx.xx%(带百分号类), 元/吨 会读成 元吨 而不是元每吨, 下划线不再会报错.
|
||||
- 类型: 优化
|
||||
- 提交: KamioRinn
|
||||
- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395)
|
||||
- 内容: 优化英语文本前端.
|
||||
- 类型: 优化
|
||||
- 提交: KamioRinn
|
||||
- 2024.02.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927)
|
||||
- 内容: 修正语种传参混乱导致中文推理效果下降.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 关联: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)
|
||||
- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403)
|
||||
- 内容: UVR5 适配更高版本的 Librosa.
|
||||
- 类型: 修复
|
||||
- 提交: StaryLan
|
||||
- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)
|
||||
- 内容: 修复 UVR5 `inf everywhere` 报错的问题 (`is_half` 传参未转换布尔类型导致恒定半精度推理, 16系显卡会 `inf`).
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2)
|
||||
- 内容: 修复 Gradio 依赖.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400)
|
||||
- 内容: 集成 Faster Whisper 实现对日语英语的语音识别.
|
||||
- 类型: 新功能
|
||||
- 提交: Shadow
|
||||
- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10)
|
||||
- 内容: 支持三连根目录留空自动读取 `.list` 全路径.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)
|
||||
- 内容: 修复 GPT 训练卡死 (win10 1909) 和系统语言繁体 GPT 训练报错.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 关联: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232)
|
||||
- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)
|
||||
- 内容: 添加 DPO 损失实验性训练选项, 通过构造负样本训练缓解 GPT 重复漏字问题, 推理界面开放数个推理参数.
|
||||
- 类型: 新功能
|
||||
- 提交: liufenghua
|
||||
- 2024.02.12 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28)
|
||||
- 内容: 优化语音识别部分逻辑. Faster Whisper 转镜像站下载, 规避 HuggingFace 连接不上的问题.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.15 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8)
|
||||
- 内容: 训练支持中文实验名称.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b)
|
||||
- 内容: DPO 训练修改为可选项而非必选项, 若勾选则 Batch Size 自动减半, 修复推理界面新参数不传参的问题.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5)
|
||||
- 内容: 修复中文文本前端错误.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499)
|
||||
- 内容: 支持无参考文本输入.
|
||||
- 类型: 新功能
|
||||
- 提交: Watchtower-Liu
|
||||
- 关联: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475)
|
||||
- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559)
|
||||
- 内容: 优化中文日文前端处理.
|
||||
- 类型: 优化
|
||||
- 提交: KamioRinn, v3cun
|
||||
- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511)
|
||||
- 内容: 修复 Colab 不开启公网 URL 的问题.
|
||||
- 类型: 修复
|
||||
- 提交: ChanningWang2018, RVC-Boss
|
||||
- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557)
|
||||
- 内容: MacOS 推理设备从 MPS 改为 CPU (CPU 推理更快).
|
||||
- 类型: 优化
|
||||
- 提交: XXXXRT666
|
||||
- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35)
|
||||
- 内容: 数据预处理添加语音降噪选项 (降噪为只剩 16K 采样率, 除非底噪很大否则不急使用).
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573)
|
||||
- 内容: 修改 `is_half` 的判断让 MacOS 能正常 CPU 推理.
|
||||
- 类型: 修复
|
||||
- 提交: XXXXRT666
|
||||
- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610)
|
||||
- 内容: 修复 UVR5 MDXNet 参数顺序错误导致输出文件夹相反.
|
||||
- 类型: 修复
|
||||
- 提交: Yuze Wang
|
||||
|
||||
## 202403
|
||||
|
||||
- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675)
|
||||
- 内容: Faster Whisper 在没有 CUDA 可用时自动使用 CPU 推理.
|
||||
- 类型: 优化
|
||||
- 提交: ShiroDoMain
|
||||
|
||||
- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193)
|
||||
- 内容: 使用 Faster Whisper 进行非中文语音识别时不再需要先下载 FunASR 模型.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- 内容: 加速推理 50% (RTX3090+PyTorch2.2.1+Cuda11.8+Win10+Py39 已测试).
|
||||
- 类型: 优化
|
||||
- 提交: GoHomeToMacDonal
|
||||
- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721)
|
||||
- 内容: 新增 `fast_inference_` 快速推理分支.
|
||||
- 类型: 新功能
|
||||
- 提交: ChasonJiang
|
||||
- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761)
|
||||
- 内容: 支持 CPU 训练, 在 MacOS 上使用 CPU 训练.
|
||||
- 类型: 新功能
|
||||
- 提交: Lion-Wu
|
||||
- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821)
|
||||
- 内容: 优化英文 G2P 文本前端.
|
||||
- 类型: 优化
|
||||
- 提交: KamioRinn
|
||||
- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894)
|
||||
- 内容: API 格式优化.
|
||||
- 类型: 优化
|
||||
- 提交: KamioRinn
|
||||
|
||||
## 202404
|
||||
|
||||
- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917)
|
||||
- 内容: 修复 UVR5 WebUI 调用 FFmpeg 时字符串格式.
|
||||
- 类型: 修复
|
||||
- 提交: StaryLan
|
||||
|
||||
## 202405
|
||||
|
||||
- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953)
|
||||
- 内容: 修复 SoVITS 训练未冻结 VQ 的问题 (可能造成效果下降).
|
||||
- 类型: 修复
|
||||
- 提交: hcwu1993
|
||||
- 关联: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747)
|
||||
- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102)
|
||||
- 内容: 添加训练数据预处理阶段不支持的语言提示.
|
||||
- 类型: 优化
|
||||
- 提交: StaryLan
|
||||
- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132)
|
||||
- 内容: 修复提取 HuBERT 特征 NaN 失败自动转 FP32 出现的错误.
|
||||
- 类型: 修复
|
||||
- 提交: XXXXRT666
|
||||
|
||||
## 202406
|
||||
|
||||
- 2024.06.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a)
|
||||
- 内容: 修复 WebUI 进行 GPT 中文微调时未读取 BERT 特征导致和推理不一致, 大量训练可能导致效果变差的问题. 若已使用大量数据微调, 建议重新微调模型得到质量优化.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159)
|
||||
- 内容: 修复 S2 训练进度条逻辑.
|
||||
- 类型: 修复
|
||||
- 提交: pengzhendong
|
||||
- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232)
|
||||
- 内容: 修复 UVR5 MDXNet 调用 FFmpeg 时字符串格式, 兼容带空格路径.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169)
|
||||
- 内容: 完善纯标点、多标点文本输入的判断逻辑.
|
||||
- 类型: 修复
|
||||
- 提交: XXXXRT666
|
||||
- 关联: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165)
|
||||
- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041)
|
||||
- 内容: 修正 CPU 推理时默认 Batch Size 为小数的问题.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267)
|
||||
- 内容: 修复降噪、识别时遇到异常跳出所有需处理的音频文件的问题.
|
||||
- 类型: 修复
|
||||
- 提交: XXXXRT666
|
||||
- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca)
|
||||
- 内容: 多卡训练多进程保存逻辑修复.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251)
|
||||
- 内容: 移除冗余 `my_utils.py`.
|
||||
- 类型: 优化
|
||||
- 提交: aoguai
|
||||
- 关联: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189)
|
||||
|
||||
## 202407
|
||||
|
||||
- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253)
|
||||
- 内容: 修复按标点符号切分时小数会被切分.
|
||||
- 类型: 修复
|
||||
- 提交: aoguai
|
||||
- 2024.07.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5)
|
||||
- 内容: 验证倍速推理代码结果和原本一致, 合并到 `main` 分支, 支持无参考文本模式.
|
||||
- 类型: 优化
|
||||
- 提交: RVC-Boss, GoHomeToMacDonal
|
||||
- 关联: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- 后续逐渐验证快速推理分支的推理改动的一致性.
|
||||
|
||||
- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298)
|
||||
- 内容: 重构 i18n 扫描并更新多语言配置文件.
|
||||
- 类型: 文档
|
||||
- 提交: StaryLan
|
||||
- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299)
|
||||
- 内容: 修复用户打文件及路径在结尾添加 `/` 会导致命令行报错的问题.
|
||||
- 类型: 修复
|
||||
- 提交: XXXXRT666
|
||||
- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756)
|
||||
- 内容: 修复训练 GPT 时采用自定义 bucket_sampler 导致步数不一致的问题.
|
||||
- 类型: 修复
|
||||
- 提交: huangxu1991
|
||||
- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340)
|
||||
- 内容: 支持合成语速调节, 支持冻结随机性只调节语速, 并将其更新到`api.py` 上.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss, 红血球AE3803
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356)
|
||||
- 内容: 增加 BS-Roformer 人声伴奏分离模型支持.
|
||||
- 类型: 新功能
|
||||
- 提交: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): 更好的中文文本前端.
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351)
|
||||
- 内容: 更好的中文文本前端.
|
||||
- 类型: 新功能
|
||||
- 提交: KamioRinn
|
||||
|
||||
## 202408 (V2 版本)
|
||||
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): 添加自动填充下一步文件路径的功能.
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355)
|
||||
- 内容: 添加自动填充下一步文件路径的功能.
|
||||
- 类型: 杂项
|
||||
- 提交: XXXXRT666
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): 支持 BS-Roformer 的 FP16 推理.
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c)
|
||||
- 内容: 支持 BS-Roformer 的 FP16 推理.
|
||||
- 类型: 性能优化
|
||||
- 提交: RVC-Boss
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): 增加用户友好逻辑, 对用户随意输入的显卡序号也能正常运行.
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78)
|
||||
- 内容: 增加用户友好逻辑, 对用户随意输入的显卡序号也能正常运行.
|
||||
- 类型: 杂项
|
||||
- 提交: RVC-Boss
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **新增 GPT-SoVITS V2 模型.**
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758)
|
||||
- 内容: **新增 GPT-SoVITS V2 模型.**
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): 增加粤语 FunASR 支持.
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3)
|
||||
- 内容: 增加粤语 FunASR 支持.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): 优化界面, 优化计时逻辑.
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388)
|
||||
- 内容: 优化界面, 优化计时逻辑.
|
||||
- 类型: 杂项
|
||||
- 提交: XXXXRT666
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): 优化多音字逻辑 (V2 版本特供).
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488)
|
||||
- 内容: 优化多音字逻辑 (V2 版本特供).
|
||||
- 类型: 修复, 新功能
|
||||
- 提交: KamioRinn, RVC-Boss
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): 修复参考音频混合只能上传一条的错误, 添加数据集检查, 缺失会弹出警告窗口.
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422)
|
||||
- 内容: 修复参考音频混合只能上传一条的错误, 添加数据集检查, 缺失会弹出警告窗口.
|
||||
- 类型: 修复, 杂项
|
||||
- 提交: XXXXRT666
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): 上游 LangSegment 库支持通过 SSML 标签优化数字、电话、时间日期等.
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508)
|
||||
- 内容: 上游 LangSegment 库支持通过 SSML 标签优化数字、电话、时间日期等.
|
||||
- 类型: 新功能
|
||||
- 提交: juntaosun
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): 修复并优化 API.
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503)
|
||||
- 内容: 修复并优化 API.
|
||||
- 类型: 修复
|
||||
- 提交: KamioRinn
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): 合并 fast_inference 分支.
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490)
|
||||
- 内容: 合并 fast_inference 分支.
|
||||
- 类型: 重构
|
||||
- 提交: ChasonJiang
|
||||
- 2024.08.21 **正式发布 GPT-SoVITS V2 版本.**
|
||||
|
||||
## 202502 (V3 版本)
|
||||
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **新增 GPT-SoVITS V3 模型, 需要 14G 显存进行微调.**
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4)
|
||||
- 内容: **新增 GPT-SoVITS V3 模型, 需要 14G 显存进行微调.**
|
||||
- 类型: 新功能 (特性参阅 [Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)))
|
||||
- 提交: RVC-Boss
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): 更新项目多语言文档.
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032)
|
||||
- 内容: 更新项目多语言文档.
|
||||
- 类型: 文档
|
||||
- 提交: StaryLan
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): 更新日语文档.
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033)
|
||||
- 内容: 更新日语文档.
|
||||
- 类型: 文档
|
||||
- 提交: Fyphen
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): 优化注意力计算逻辑.
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010)
|
||||
- 内容: 优化注意力计算逻辑.
|
||||
- 类型: 性能优化
|
||||
- 提交: wzy3650
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): 微调添加梯度检查点支持, 需要 12G 显存进行微调.
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040)
|
||||
- 内容: 微调添加梯度检查点支持, 需要 12G 显存进行微调.
|
||||
- 类型: 新功能
|
||||
- 提交: Kakaru Hayate
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): 切换新的语言分割工具, 优化多语种混合文本切分策略, 优化文本里的数字和英文处理逻辑.
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073)
|
||||
- 内容: 切换新的语言分割工具, 优化多语种混合文本切分策略, 优化文本里的数字和英文处理逻辑.
|
||||
- 类型: 新功能
|
||||
- 提交: KamioRinn
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 模型支持 LoRA 训练, 需要 8G 显存进行微调.**
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e)
|
||||
- 内容: **GPT-SoVITS V3 模型支持 LoRA 训练, 需要 8G 显存进行微调.**
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): 人声背景音分离增加 Mel Band Roformer 模型支持.
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078)
|
||||
- 内容: 人声背景音分离增加 Mel Band Roformer 模型支持.
|
||||
- 类型: 新功能
|
||||
- 提交: Sucial
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): 修复中文路径下 Mecab 的报错 (具体表现为日文韩文、文本混合语种切分可能会遇到的报错).
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114)
|
||||
- 内容: 修复中文路径下 Mecab 的报错 (具体表现为日文韩文、文本混合语种切分可能会遇到的报错).
|
||||
- 类型: 修复
|
||||
- 提交: KamioRinn
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **支持使用 24KHz 转 48kHz 的音频超分模型**, 缓解 V3 模型生成音频感觉闷的问题.
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc)
|
||||
- 内容: **支持使用 24KHz 转 48kHz 的音频超分模型**, 缓解 V3 模型生成音频感觉闷的问题.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 关联: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): 更新项目多语言文档
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123)
|
||||
- 内容: 更新项目多语言文档
|
||||
- 类型: 文档
|
||||
- 提交: StaryLan
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): 对于模型无法判断的CJK短字符采用规则判断.
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122)
|
||||
- 内容: 对于模型无法判断的CJK短字符采用规则判断.
|
||||
- 类型: 修复
|
||||
- 提交: KamioRinn
|
||||
- 关联: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116)
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): 增加语速传参以支持调整合成语速.
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5)
|
||||
- 内容: 增加语速传参以支持调整合成语速.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2025.02.28 **正式发布 GPT-SoVITS V3**.
|
||||
|
||||
## 202503
|
||||
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): 修复一批由依赖的库版本不对导致的问题.
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236)
|
||||
- 内容: 修复一批由依赖的库版本不对导致的问题.
|
||||
- 类型: 修复
|
||||
- 提交: XXXXRT666
|
||||
- 关联:
|
||||
- 关联
|
||||
- PyOpenJTalk: [Issue#1131](https://github.com/RVC-Boss/GPT-SoVITS/issues/1131), [Issue#2231](https://github.com/RVC-Boss/GPT-SoVITS/issues/2231), [Issue#2233](https://github.com/RVC-Boss/GPT-SoVITS/issues/2233).
|
||||
- ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841).
|
||||
- Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239).
|
||||
- PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174).
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **为 SoVITS v3 适配并行推理**.
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241)
|
||||
- 内容: **为 SoVITS v3 适配并行推理**.
|
||||
- 类型: 新功能
|
||||
- 提交: ChasonJiang
|
||||
|
||||
@@ -324,73 +483,98 @@
|
||||
|
||||
- 整合包修复 onnxruntime GPU 推理的支持
|
||||
- 类型: 修复
|
||||
- 内容:
|
||||
- 内容
|
||||
- G2PW 内的 ONNX 模型由 CPU 推理 换为 GPU, 显著降低推理的 CPU 瓶颈;
|
||||
- foxjoy 去混响模型现在可使用 GPU 推理
|
||||
|
||||
## 202504 (V4 版本)
|
||||
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): 解锁 SoVITS v3 并行推理, 修复模型加载异步逻辑.
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f)
|
||||
- 内容: 解锁 SoVITS v3 并行推理, 修复模型加载异步逻辑.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruff 格式化代码, 更新 G2PW 链接.
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255)
|
||||
- 内容: Ruff 格式化代码, 更新 G2PW 链接.
|
||||
- 类型: 风格
|
||||
- 提交: XXXXRT666
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): 清理文档, 支持 Python 3.11, 更新安装文件.
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290)
|
||||
- 内容: 清理文档, 支持 Python 3.11, 更新安装文件.
|
||||
- 类型: 杂项
|
||||
- 提交: XXXXRT666
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): 更新 Colab, 安装文件和模型下载.
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300)
|
||||
- 内容: 更新 Colab, 安装文件和模型下载.
|
||||
- 类型: 杂项
|
||||
- 提交: XXXXRT666
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **新增 GPT-SoVITS V4 模型**.
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf)
|
||||
- 内容: **新增 GPT-SoVITS V4 模型**.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): 适配 V4 并行推理.
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307)
|
||||
- 内容: 适配 V4 并行推理.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): 修复模型版本传参.
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309)
|
||||
- 内容: 修复模型版本传参.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): 修复 Numpy 与 Numba 版本不匹配问题, 更新 librosa 版本.
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310)
|
||||
- 内容: 修复 Numpy 与 Numba 版本不匹配问题, 更新 librosa 版本.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss, XXXXRT666
|
||||
- 关联: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308)
|
||||
- **2024.04.22 正式发布 GPT-SoVITS V4**.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): 更新 Gradio 参数.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311)
|
||||
- 内容: 更新 Gradio 参数.
|
||||
- 类型: 杂项
|
||||
- 提交: XXXXRT666
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): 完善 Colab/Kaggle Notebook 脚本.
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322)
|
||||
- 内容: 完善 Colab/Kaggle Notebook 脚本.
|
||||
- 类型: 杂项
|
||||
- 提交: XXXXRT666
|
||||
|
||||
## 202505
|
||||
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): 完善 Docker, Windows 自动构建脚本, Pre-Commit 格式化.
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351)
|
||||
- 内容: 完善 Docker, Windows 自动构建脚本, Pre-Commit 格式化.
|
||||
- 类型: 杂项
|
||||
- 提交: XXXXRT666
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): 优化混合语种切分识别逻辑.
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408)
|
||||
- 内容: 优化混合语种切分识别逻辑.
|
||||
- 类型: 修复
|
||||
- 提交: KamioRinn
|
||||
- 关联: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404)
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): 通过缓存策略使 SoVITS V3/V4 推理提速 10%.
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377)
|
||||
- 内容: 通过缓存策略使 SoVITS V3/V4 推理提速 10%.
|
||||
- 类型: 性能优化
|
||||
- 提交: Kakaru Hayate
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): 更新标注界面, 增加友情提示, 即标注完每一页都要点击 `Submit Text` 否则修改无效.
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba)
|
||||
- 内容: 更新标注界面, 增加友情提示, 即标注完每一页都要点击 `Submit Text` 否则修改无效.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): 修复 UVR5 和 ONNX 去混响模型使用 FFmpeg 编码 MP3 和 M4A 原路径带空格时的错误.
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc)
|
||||
- 内容: 修复 UVR5 和 ONNX 去混响模型使用 FFmpeg 编码 MP3 和 M4A 原路径带空格时的错误.
|
||||
- 类型: 修复
|
||||
- 提交: RVC-Boss
|
||||
|
||||
## 202506 (V2Pro 系列)
|
||||
- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70): **新增 GPT-SoVITS V2Pro 系列模型**.
|
||||
|
||||
- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420)
|
||||
- 内容: 更新项目多语言文档.
|
||||
- 类型: 文档
|
||||
- 提交: StaryLan
|
||||
- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417)
|
||||
- 内容: 支持 torchscript 导出 V4 模型.
|
||||
- 类型: 新功能
|
||||
- 提交: L-jasmine
|
||||
- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70)
|
||||
- 内容: **新增 GPT-SoVITS V2Pro 系列模型**.
|
||||
- 类型: 新功能
|
||||
- 提交: RVC-Boss
|
||||
- 2025.06.05 https://github.com/RVC-Boss/GPT-SoVITS/pull/2426: config/inference_webui初始化bug修复.
|
||||
- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426)
|
||||
- 内容: `config/inference_webui` 初始化错误修复.
|
||||
- 类型: 修复
|
||||
- 提交: SapphireLab
|
||||
- 2025.06.05 https://github.com/RVC-Boss/GPT-SoVITS/pull/2427: 优化精度自动检测逻辑;给webui前端界面模块增加可收缩式支持.
|
||||
- 提交: StaryLan
|
||||
- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434)
|
||||
- 内容: 优化精度自动检测逻辑, 给 WebUI 前端界面模块增加折叠功能.
|
||||
- 类型: 新功能
|
||||
- 提交: XXXXRT666
|
||||
|
||||
|
||||
- 提交: XXXXRT666, RVC-Boss
|
||||
|
||||
@@ -309,6 +309,38 @@ python webui.py
|
||||
|
||||
如果想用音频超分功能缓解 v3 模型生成 24k 音频觉得闷的问题, 需要下载额外的模型参数, 参考[how to download](../../tools/AP_BWE_main/24kto48k/readme.txt)
|
||||
|
||||
## V4 更新说明
|
||||
|
||||
新特性:
|
||||
|
||||
1. **V4 版本修复了 V3 版本中由于非整数倍上采样导致的金属音问题, 并原生输出 48kHz 音频以避免声音闷糊 (而 V3 版本仅原生输出 24kHz 音频)**. 作者认为 V4 是对 V3 的直接替代, 但仍需进一步测试.
|
||||
[更多详情](<https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3v4%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)>)
|
||||
|
||||
从 V1/V2/V3 环境迁移至 V4:
|
||||
|
||||
1. 执行 `pip install -r requirements.txt` 更新部分依赖包.
|
||||
|
||||
2. 从 GitHub 克隆最新代码.
|
||||
|
||||
3. 从 [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) 下载 V4 预训练模型 (`gsv-v4-pretrained/s2v4.ckpt` 和 `gsv-v4-pretrained/vocoder.pth`), 并放入 `GPT_SoVITS/pretrained_models` 目录.
|
||||
|
||||
## V2Pro 更新说明
|
||||
|
||||
新特性:
|
||||
|
||||
1. **相比 V2 占用稍高显存, 性能超过 V4, 在保留 V2 硬件成本和推理速度优势的同时实现更高音质.**
|
||||
[更多详情](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90features-(%E5%90%84%E7%89%88%E6%9C%AC%E7%89%B9%E6%80%A7))
|
||||
|
||||
2. V1/V2 与 V2Pro 系列具有相同特性, V3/V4 则具备相近功能. 对于平均音频质量较低的训练集, V1/V2/V2Pro 可以取得较好的效果, 但 V3/V4 无法做到. 此外, V3/V4 合成的声音更偏向参考音频, 而不是整体训练集的风格.
|
||||
|
||||
从 V1/V2/V3/V4 环境迁移至 V2Pro:
|
||||
|
||||
1. 执行 `pip install -r requirements.txt` 更新部分依赖包.
|
||||
|
||||
2. 从 GitHub 克隆最新代码.
|
||||
|
||||
3. 从 [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) 下载 V2Pro 预训练模型 (`v2Pro/s2Dv2Pro.pth`, `v2Pro/s2Gv2Pro.pth`, `v2Pro/s2Dv2ProPlus.pth`, `v2Pro/s2Gv2ProPlus.pth`, 和 `sv/pretrained_eres2netv2w24s4ep4.ckpt`), 并放入 `GPT_SoVITS/pretrained_models` 目录.
|
||||
|
||||
## 待办事项清单
|
||||
|
||||
- [x] **高优先级:**
|
||||
@@ -391,6 +423,7 @@ python ./tools/asr/fasterwhisper_asr.py -i <input> -o <output> -l <language> -p
|
||||
- [Chinese Speech Pretrain](https://github.com/TencentGameMate/chinese_speech_pretrain)
|
||||
- [Chinese-Roberta-WWM-Ext-Large](https://huggingface.co/hfl/chinese-roberta-wwm-ext-large)
|
||||
- [BigVGAN](https://github.com/NVIDIA/BigVGAN)
|
||||
- [eresnetv2](https://modelscope.cn/models/iic/speech_eres2netv2w24s4ep4_sv_zh-cn_16k-common)
|
||||
|
||||
### 推理用文本前端
|
||||
|
||||
|
||||
@@ -1,262 +1,472 @@
|
||||
# Changelog
|
||||
|
||||
## 20240121
|
||||
## 202401
|
||||
|
||||
1. Added `is_share` to the `config`. In scenarios like Colab, this can be set to `True` to map the WebUI to the public network.
|
||||
2. Added English system translation support to WebUI.
|
||||
3. The `cmd-asr` automatically detects if the FunASR model is included; if not found in the default directory, it will be downloaded from ModelScope.
|
||||
4. Attempted to fix the SoVITS training ZeroDivisionError reported in [Issue 79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) by filtering samples with zero length, etc.
|
||||
5. Cleaned up cached audio files and other files in the `TEMP` folder.
|
||||
6. Significantly reduced the issue of synthesized audio containing the end of the reference audio.
|
||||
- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108)
|
||||
- Content: Added English system translation support to WebUI.
|
||||
- Type: Documentation
|
||||
- Contributor: D3lik
|
||||
- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e)
|
||||
- Content: Attempted to fix SoVITS training ZeroDivisionError.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss, Tybost
|
||||
- Related: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)
|
||||
- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3)
|
||||
- Content: Significantly reduced the issue of synthesized audio containing the end of the reference audio.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef)
|
||||
- Content: `cmd-asr.py` now checks if the FunASR model is included in the default directory, and if not, it will download it from ModelScope.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d)
|
||||
- Content: `Config.py` now has an `is_share` parameter, which can be set to `True` to map the WebUI to the public network.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f)
|
||||
- Content: Cleaned up cached audio files and other files in the `TEMP` folder.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68)
|
||||
- Content: Fixed the issue where excessively short output files resulted in repeating the reference audio.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.22 Tested native support for English and Japanese training (Japanese training requires the root directory to be free of non-English special characters).
|
||||
- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124)
|
||||
- Content: Improved audio path checking. If an attempt is made to read from an incorrect input path, it will report that the path does not exist instead of an ffmpeg error.
|
||||
- Type: Optimization
|
||||
- Contributor: xmimu
|
||||
- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1)
|
||||
- Content: Resolved the issue where Hubert extraction caused NaN errors, leading to SoVITS/GPT training ZeroDivisionError.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50)
|
||||
- Content: Replaced `jieba` with `jieba_fast` for Chinese word segmentation.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc)
|
||||
- Content: Optimized model file sorting logic.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f)
|
||||
- Content: Added support for quick model switching in the inference WebUI.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b)
|
||||
- Content: Removed redundant logs in the inference WebUI.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200)
|
||||
- Content: Supported training and inference on Mac.
|
||||
- Type: Feature
|
||||
- Contributor: Lion-Wu
|
||||
- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b)
|
||||
- Content: Fixed the issue of UVR5 reading and automatically jumping out of directories.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204)
|
||||
- Content: Added support for Chinese-English mixed and Japanese-English mixed output texts.
|
||||
- Type: Feature
|
||||
- Contributor: Kakaru Hayate
|
||||
- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7)
|
||||
- Content: Added optional segmentation mode for output.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180)
|
||||
- Content: Fixed multiple newline issues causing inference errors.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b)
|
||||
- Content: Automatically forced single precision for GPU that do not support half precision; enforced single precision under CPU inference.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238)
|
||||
- Content: Completed model downloading process in the Dockerfile.
|
||||
- Type: Fix
|
||||
- Contributor: breakstring
|
||||
- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257)
|
||||
- Content: Fixed the issue with the pronunciation of numbers converting to Chinese characters.
|
||||
- Type: Fix
|
||||
- Contributor: duliangang
|
||||
- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683)
|
||||
- Content: Fixed the issue where GPT training did not save checkpoints.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8)
|
||||
- Content: Excluded unreasonable reference audio lengths by setting restrictions.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3)
|
||||
- Content: Fixed the issue where swallowing a few characters at the beginning of sentences.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0)
|
||||
- Content: Changed training configurations to single precision for GPUs like the 16 series, which have issues with half precision training.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec)
|
||||
- Content: Tested and updated the available Colab version.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135)
|
||||
- Content: Updated FunASR to Version 1.0 and fixed errors caused by interface misalignment.
|
||||
- Type: Fix
|
||||
- Contributor: LauraGPT
|
||||
- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4)
|
||||
- Content: Fixed issues with splitting Chinese and English punctuation and added punctuation at the beginning and end of sentences.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2)
|
||||
- Content: Added splitting by punctuation.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7)
|
||||
- Content: Automatically removed double quotes from all path-related entries to prevent errors from novice users copying paths with double quotes.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
|
||||
## 20240122
|
||||
## 202402
|
||||
|
||||
1. Fixed the issue where excessively short output files resulted in repeating the reference audio.
|
||||
2. Tested native support for English and Japanese training (Japanese training requires the root directory to be free of non-English special characters).
|
||||
3. Improved audio path checking. If an attempt is made to read from an incorrect input path, it will report that the path does not exist instead of an ffmpeg error.
|
||||
|
||||
## 20240123
|
||||
|
||||
1. Resolved the issue where Hubert extraction caused NaN errors, leading to SoVITS/GPT training ZeroDivisionError.
|
||||
2. Added support for quick model switching in the inference WebUI.
|
||||
3. Optimized the model file sorting logic.
|
||||
4. Replaced `jieba` with `jieba_fast` for Chinese word segmentation.
|
||||
|
||||
## 20240126
|
||||
|
||||
1. Added support for Chinese-English mixed and Japanese-English mixed output texts.
|
||||
2. Added an optional segmentation mode for output.
|
||||
3. Fixed the issue of UVR5 reading and automatically jumping out of directories.
|
||||
4. Fixed multiple newline issues causing inference errors.
|
||||
5. Removed redundant logs in the inference WebUI.
|
||||
6. Supported training and inference on Mac.
|
||||
7. Automatically forced single precision for GPU that do not support half precision; enforced single precision under CPU inference.
|
||||
|
||||
## 20240128
|
||||
|
||||
1. Fixed the issue with the pronunciation of numbers converting to Chinese characters.
|
||||
2. Fixed the issue of swallowing a few characters at the beginning of sentences.
|
||||
3. Excluded unreasonable reference audio lengths by setting restrictions.
|
||||
4. Fixed the issue where GPT training did not save checkpoints.
|
||||
5. Completed model downloading process in the Dockerfile.
|
||||
|
||||
## 20240129
|
||||
|
||||
1. Changed training configurations to single precision for GPUs like the 16 series, which have issues with half precision training.
|
||||
2. Tested and updated the available Colab version.
|
||||
3. Fixed the issue of git cloning the ModelScope FunASR repository with older versions of FunASR causing interface misalignment errors.
|
||||
|
||||
## 20240130
|
||||
|
||||
1. Automatically removed double quotes from all path-related entries to prevent errors from novice users copying paths with double quotes.
|
||||
2. Fixed issues with splitting Chinese and English punctuation and added punctuation at the beginning and end of sentences.
|
||||
3. Added splitting by punctuation.
|
||||
|
||||
## 20240201
|
||||
|
||||
1. Fixed the UVR5 format reading error causing separation failures.
|
||||
2. Supported automatic segmentation and language recognition for mixed Chinese-Japanese-English texts.
|
||||
|
||||
## 20240202
|
||||
|
||||
1. Fixed the issue where an ASR path ending with `/` caused an error in saving the filename.
|
||||
2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) introduced PaddleSpeech's Normalizer to fix issues like reading "xx.xx%" (percent symbols) and "元/吨" being read as "元吨" instead of "元每吨", and fixed underscore errors.
|
||||
|
||||
## 20240207
|
||||
|
||||
1. Corrected language parameter confusion causing decreased Chinese inference quality reported in [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391).
|
||||
2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) adapted UVR5 to higher versions of librosa.
|
||||
3. [Commit 14a2851](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) fixed UVR5 inf everywhere error caused by `is_half` parameter not converting to boolean, resulting in constant half precision inference, which caused `inf` on 16 series GPUs.
|
||||
4. Optimized English text frontend.
|
||||
5. Fixed Gradio dependencies.
|
||||
6. Supported automatic reading of `.list` full paths if the root directory is left blank during dataset preparation.
|
||||
7. Integrated Faster Whisper ASR for Japanese and English.
|
||||
|
||||
## 20240208
|
||||
|
||||
1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) attempted to fix GPT training hang on Windows 10 1909 and [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) (Traditional Chinese System Language).
|
||||
|
||||
## 20240212
|
||||
|
||||
1. Optimized logic for Faster Whisper and FunASR, switching Faster Whisper to mirror downloads to avoid issues with Hugging Face connections.
|
||||
2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) enabled experimental DPO Loss training option to mitigate GPT repetition and missing characters by constructing negative samples during training and made several inference parameters available in the inference WebUI.
|
||||
|
||||
## 20240214
|
||||
|
||||
1. Supported Chinese experiment names in training (previously caused errors).
|
||||
2. Made DPO training an optional feature instead of mandatory. If selected, the batch size is automatically halved. Fixed issues with new parameters not being passed in the inference WebUI.
|
||||
|
||||
## 20240216
|
||||
|
||||
1. Supported input without reference text.
|
||||
2. Fixed bugs in Chinese frontend reported in [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475).
|
||||
|
||||
## 20240221
|
||||
|
||||
1. Added a noise reduction option during data processing (noise reduction leaves only 16kHz sampling rate; use only if the background noise is significant).
|
||||
2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) optimized Chinese and Japanese frontend processing.
|
||||
3. Switched Mac CPU inference to use CPU instead of MPS for faster performance.
|
||||
4. Fixed Colab public URL issue.
|
||||
|
||||
## 20240306
|
||||
|
||||
1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) accelerated inference by 50% (tested on RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39) .
|
||||
2. No longer requires downloading the Chinese FunASR model first when using Faster Whisper non-Chinese ASR.
|
||||
3. [PR 610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) fixed UVR5 reverb removal model where the setting was reversed.
|
||||
4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) enabled automatic CPU inference for Faster Whisper if no CUDA is available.
|
||||
5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) modified `is_half` check to ensure proper CPU inference on Mac.
|
||||
|
||||
## 202403/202404/202405
|
||||
|
||||
### Minor Fixes:
|
||||
|
||||
1. Fixed issues with the no-reference text mode.
|
||||
2. Optimized the Chinese and English text frontend.
|
||||
3. Improved API format.
|
||||
4. Fixed CMD format issues.
|
||||
5. Added error prompts for unsupported languages during training data processing.
|
||||
6. Fixed the bug in Hubert extraction.
|
||||
|
||||
### Major Fixes:
|
||||
|
||||
1. Fixed the issue of SoVITS training without freezing VQ (which could cause quality degradation).
|
||||
2. Added a quick inference branch.
|
||||
|
||||
## 20240610
|
||||
|
||||
### Minor Fixes:
|
||||
|
||||
1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) improved the logic for pure punctuation and multi-punctuation text input.
|
||||
2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) fixed CMD format for MDXNet de-reverb in UVR5, supporting paths with spaces.
|
||||
3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) fixed progress bar logic for SoVITS training in `s2_train.py`.
|
||||
|
||||
### Major Fixes:
|
||||
|
||||
4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) fixed the issue of WebUI's GPT fine-tuning not reading BERT feature of Chinese input texts, causing inconsistency with inference and potential quality degradation.
|
||||
**Caution: If you have previously fine-tuned with a large amount of data, it is recommended to retune the model to improve quality.**
|
||||
|
||||
## 20240706
|
||||
|
||||
### Minor Fixes:
|
||||
|
||||
1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) fixed default batch size decimal issue in CPU inference.
|
||||
2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) fixed issues where denoising or ASR encountering exceptions would exit all pending audio files.
|
||||
3. [PR 1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) fixed the issue of splitting decimals when splitting by punctuation.
|
||||
4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) fixed multi-process save logic for multi-GPU training.
|
||||
5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) removed redundant `my_utils`.
|
||||
|
||||
### Major Fixes:
|
||||
|
||||
6. The accelerated inference code from [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) has been validated and merged into the main branch, ensuring consistent inference effects with the base.
|
||||
It also supports accelerated inference in no-reference text mode.
|
||||
|
||||
**Future updates will continue to verify the consistency of changes in the `fast_inference` branch**.
|
||||
|
||||
## 20240727
|
||||
|
||||
### Minor Fixes:
|
||||
|
||||
1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) cleaned up redundant i18n code.
|
||||
2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) fixed issues where trailing slashes in user file paths caused command line errors.
|
||||
3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) fixed the step calculation logic in GPT training.
|
||||
|
||||
### Major Fixes:
|
||||
|
||||
4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) supported speech rate adjustment for synthesis.
|
||||
Enabled freezing randomness while only adjusting the speech rate.
|
||||
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): Added support for the BS-RoFormer vocal accompaniment separation model.
|
||||
- Type: New Feature
|
||||
- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6)
|
||||
- Content: Fixed the issue where an ASR path ending with `/` caused an error in saving the filename.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7)
|
||||
- Content: Fixed the UVR5 format reading error causing separation failures.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7)
|
||||
- Content: Supported automatic segmentation and language recognition for mixed Chinese-Japanese-English texts.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377)
|
||||
- Content: introduced PaddleSpeech's Normalizer to fix issues like reading "xx.xx%" (percent symbols) and "元/吨" being read as "元吨" instead of "元每吨", and fixed underscore errors.
|
||||
- Type: Optimization
|
||||
- Contributor: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): Improved Chinese text frontend.
|
||||
- Type: New Feature
|
||||
- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395)
|
||||
- Content: Optimized English text frontend.
|
||||
- Type: Optimization
|
||||
- Contributor: KamioRinn
|
||||
- 2024.02.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927)
|
||||
- Content: Corrected language parameter confusion causing decreased Chinese inference quality.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- Related: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)
|
||||
- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403)
|
||||
- Content: Adapted UVR5 to higher versions of librosa.
|
||||
- Type: Fix
|
||||
- Contributor: StaryLan
|
||||
- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)
|
||||
- Content: Fixed UVR5 inf everywhere error caused by `is_half` parameter not converting to boolean, resulting in constant half precision inference, which caused `inf` on 16 series GPUs.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2)
|
||||
- Content: Fixed Gradio dependencies.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400)
|
||||
- Content: Integrated Faster Whisper ASR for Japanese and English.
|
||||
- Type: Feature
|
||||
- Contributor: Shadow
|
||||
- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10)
|
||||
- Content: Supported automatic reading of `.list` full paths if the root directory is left blank during dataset preparation.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)
|
||||
- Content: Attempted to fix GPT training hang on Windows 10 1909 and Traditional Chinese System Language.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- Related: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232)
|
||||
- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)
|
||||
- Content: Enabled experimental DPO Loss training option to mitigate GPT repetition and missing characters by constructing negative samples during training and made several inference parameters available in the inference WebUI.
|
||||
- Type: Feature
|
||||
- Contributor: liufenghua
|
||||
- 2024.02.12 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28)
|
||||
- Content: Optimized logic for Faster Whisper and FunASR, switching Faster Whisper to mirror downloads to avoid issues with Hugging Face connections.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.15 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8)
|
||||
- Content: Supported Chinese experiment names in training (previously caused errors).
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b)
|
||||
- Content: Made DPO training an optional feature instead of mandatory. If selected, the batch size is automatically halved. Fixed issues with new parameters not being passed in the inference WebUI.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5)
|
||||
- Content: Fixed bugs in Chinese frontend.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499)
|
||||
- Content: Supported input without reference text.
|
||||
- Type: Feature
|
||||
- Contributor: Watchtower-Liu
|
||||
- Related: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475)
|
||||
- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559)
|
||||
- Content: Optimized Chinese and Japanese frontend processing.
|
||||
- Type: Optimization
|
||||
- Contributor: KamioRinn, v3cun
|
||||
- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511)
|
||||
- Content: Fixed Colab public URL issue.
|
||||
- Type: Fix
|
||||
- Contributor: ChanningWang2018, RVC-Boss
|
||||
- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557)
|
||||
- Content: Switched Mac CPU inference to use CPU instead of MPS for faster performance.
|
||||
- Type: Optimization
|
||||
- Contributor: XXXXRT666
|
||||
- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35)
|
||||
- Content: Added a noise reduction option during data processing (noise reduction leaves only 16kHz sampling rate; use only if the background noise is significant).
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573)
|
||||
- Content: Modified `is_half` check to ensure proper CPU inference on Mac.
|
||||
- Type: Fix
|
||||
- Contributor: XXXXRT666
|
||||
- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610)
|
||||
- Content: Fixed UVR5 reverb removal model where the setting was reversed.
|
||||
- Type: Fix
|
||||
- Contributor: Yuze Wang
|
||||
|
||||
## 202403
|
||||
|
||||
- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675)
|
||||
- Content: Enabled automatic CPU inference for Faster Whisper if no CUDA is available.
|
||||
- Type: Optimization
|
||||
- Contributor: ShiroDoMain
|
||||
- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193)
|
||||
- Content: No longer requires downloading the Chinese FunASR model first when using Faster Whisper non-Chinese ASR.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- Content: Accelerated inference by 50% (tested on RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39).
|
||||
- Type: Optimization
|
||||
- Contributor: GoHomeToMacDonal
|
||||
- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721)
|
||||
- Content: Added a quick inference branch `fast_inference_`.
|
||||
- Type: Feature
|
||||
- Contributor: ChasonJiang
|
||||
- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761)
|
||||
- Content: Supported CPU training, using CPU for training on macOS.
|
||||
- Type: Feature
|
||||
- Contributor: Lion-Wu
|
||||
- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821)
|
||||
- Content: Optimized the English text frontend.
|
||||
- Type: Optimization
|
||||
- Contributor: KamioRinn
|
||||
- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894)
|
||||
- Content: Improved API format.
|
||||
- Type: Optimization
|
||||
- Contributor: KamioRinn
|
||||
|
||||
## 202404
|
||||
|
||||
- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917)
|
||||
- Content: Corrected FFmpeg command string formatting in UVR5 WebUI.
|
||||
- Type: Fix
|
||||
- Contributor: StaryLan
|
||||
|
||||
## 202405
|
||||
|
||||
- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953)
|
||||
- Content: Fixed the issue of SoVITS training without freezing VQ (which could cause quality degradation).
|
||||
- Type: Fix
|
||||
- Contributor: hcwu1993
|
||||
- Related: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747)
|
||||
- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102)
|
||||
- Content: Added error prompts for unsupported languages during training data processing.
|
||||
- Type: Optimization
|
||||
- Contributor: StaryLan
|
||||
- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132)
|
||||
- Content: Fixed the bug in Hubert extraction.
|
||||
- Type: Fix
|
||||
- Contributor: XXXXRT666
|
||||
|
||||
## 202406
|
||||
|
||||
- 2024.06.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a)
|
||||
- Content: Fixed the issue of WebUI's GPT fine-tuning not reading BERT feature of Chinese input texts, causing inconsistency with inference and potential quality degradation.
|
||||
**Caution: If you have previously fine-tuned with a large amount of data, it is recommended to retune the model to improve quality.**
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159)
|
||||
- Content: Fixed progress bar logic for SoVITS training in `s2_train.py`.
|
||||
- Type: Fix
|
||||
- Contributor: pengzhendong
|
||||
- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232)
|
||||
- Content: Fixed string formatting when UVR5 MDXNet calls FFmpeg, ensuring compatibility with paths containing spaces.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169)
|
||||
- Content: Improved the logic for pure punctuation and multi-punctuation text input.
|
||||
- Type: Fix
|
||||
- Contributor: XXXXRT666
|
||||
- Related: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165)
|
||||
- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041)
|
||||
- Content: Fixed default batch size decimal issue in CPU inference.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267)
|
||||
- Content: Fixed issues where denoising or ASR encountering exceptions would exit all pending audio files.
|
||||
- Type: Fix
|
||||
- Contributor: XXXXRT666
|
||||
- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca)
|
||||
- Content: Fixed multi-process save logic for multi-GPU training.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251)
|
||||
- Content: Removed redundant `my_utils.py`.
|
||||
- Type: Optimization
|
||||
- Contributor: aoguai
|
||||
- Related: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189)
|
||||
|
||||
## 202407
|
||||
|
||||
- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253)
|
||||
- Content: Fixed the issue of splitting decimals when splitting by punctuation.
|
||||
- Type: Fix
|
||||
- Contributor: aoguai
|
||||
- 2024.07.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5)
|
||||
- Content: The accelerated inference code has been validated and merged into the main branch, ensuring consistent inference effects with the base. It also supports accelerated inference in no-reference text mode.
|
||||
- Type: Optimization
|
||||
- Contributor: RVC-Boss, GoHomeToMacDonal
|
||||
- Related: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- Future updates will continue to verify the consistency of changes in the `fast_inference` branch.
|
||||
|
||||
- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298)
|
||||
- Content: Refactor i18n scanning and update multi-language configuration files.
|
||||
- Type: Documentation
|
||||
- Contributor: StaryLan
|
||||
- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299)
|
||||
- Content: Fixed issues where trailing slashes in user file paths caused command line errors.
|
||||
- Type: Fix
|
||||
- Contributor: XXXXRT666
|
||||
- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756)
|
||||
- Content: Fix the inconsistency in training steps when using a custom `bucket_sampler` during GPT training.
|
||||
- Type: Fix
|
||||
- Contributor: huangxu1991
|
||||
- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340)
|
||||
- Content: Support adjusting speech speed during synthesis, including an option to freeze randomness and only control speed. This feature has been updated to `api.py`.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss, 红血球AE3803
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356)
|
||||
- Content: Added support for the BS-RoFormer vocal accompaniment separation model.
|
||||
- Type: Feature
|
||||
- Contributor: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351)
|
||||
- Content: Improved Chinese text frontend.
|
||||
- Type: Feature
|
||||
- Contributor: KamioRinn
|
||||
|
||||
## 202408 (V2 Version)
|
||||
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): Automatically fill in the paths when processing files in the WebUI.
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355)
|
||||
- Content: Automatically fill in the paths when processing files in the WebUI.
|
||||
- Type: Chore
|
||||
- Contributor: XXXXRT666
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): Enabled FP16 inference support for BS-Roformer.
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c)
|
||||
- Content: Enabled FP16 inference support for BS-Roformer.
|
||||
- Type: Performance Optimization
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): Optimized GPU recognition logic, added user-friendly logic to handle arbitrary GPU indices entered by users.
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78)
|
||||
- Content: Optimized GPU recognition logic, added user-friendly logic to handle arbitrary GPU indices entered by users.
|
||||
- Type: Chore
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **Added GPT-SoVITS V2 model.**
|
||||
- Type: New Feature
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758)
|
||||
- Content: **Added GPT-SoVITS V2 model.**
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): Added support for Cantonese ASR by using FunASR.
|
||||
- Type: New Feature
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3)
|
||||
- Content: Added support for Cantonese ASR by using FunASR.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): Optimized UI and timing logic.
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388)
|
||||
- Content: Optimized UI and timing logic.
|
||||
- Type: Chore
|
||||
- Contributor: XXXXRT666
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): Optimized polyphonic character handling logic (V2 Only).
|
||||
- Type: Fix, New Feature
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488)
|
||||
- Content: Optimized polyphonic character handling logic (V2 Only).
|
||||
- Type: Fix, Feature
|
||||
- Contributor: KamioRinn, RVC-Boss
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): Fixed bug where only one reference audio could be uploaded; added dataset validation with warning popups for missing files.
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422)
|
||||
- Content: Fixed bug where only one reference audio could be uploaded; added dataset validation with warning popups for missing files.
|
||||
- Type: Fix, Chore
|
||||
- Contributor: XXXXRT666
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): Upstream LangSegment library now supports optimizing numbers, phone numbers, dates, and times using SSML tags.
|
||||
- Type: New Feature
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508)
|
||||
- Content: Upstream LangSegment library now supports optimizing numbers, phone numbers, dates, and times using SSML tags.
|
||||
- Type: Feature
|
||||
- Contributor: juntaosun
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): Fixed and optimized API.
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503)
|
||||
- Content: Fixed and optimized API.
|
||||
- Type: Fix
|
||||
- Contributor: KamioRinn
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): Merged `fast_inference` branch into the main branch.
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490)
|
||||
- Content: Merged `fast_inference` branch into the main branch.
|
||||
- Type: Refactor
|
||||
- Contributor: ChasonJiang
|
||||
- 2024.08.21 **Officially released GPT-SoVITS V2 version.**
|
||||
|
||||
## 202502 (V3 Version)
|
||||
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **Added GPT-SoVITS V3 model, which requires 14GB VRAM for fine-tuning.**
|
||||
- Type: New Feature (Refer to [Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)))
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4)
|
||||
- Content: **Added GPT-SoVITS V3 model, which requires 14GB VRAM for fine-tuning.**
|
||||
- Type: Feature (Refer to [Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)))
|
||||
- Contributor: RVC-Boss
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): Updated multilingual project documentation.
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032)
|
||||
- Content: Updated multilingual project documentation.
|
||||
- Type: Documentation
|
||||
- Contributor: StaryLan
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): Updated Japanese documentation.
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033)
|
||||
- Content: Updated Japanese documentation.
|
||||
- Type: Documentation
|
||||
- Contributor: Fyphen
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): Optimized attention calculation logic.
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010)
|
||||
- Content: Optimized attention calculation logic.
|
||||
- Type: Performance Optimization
|
||||
- Contributor: wzy3650
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): Added gradient checkpointing support for fine-tuning, requiring 12GB VRAM.
|
||||
- Type: New Feature
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040)
|
||||
- Content: Added gradient checkpointing support for fine-tuning, requiring 12GB VRAM.
|
||||
- Type: Feature
|
||||
- Contributor: Kakaru Hayate
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): Switched to a new language segmentation tool, improved multilingual mixed-text splitting strategy, and optimized number and English processing logic.
|
||||
- Type: New Feature
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073)
|
||||
- Content: Switched to a new language segmentation tool, improved multilingual mixed-text splitting strategy, and optimized number and English processing logic.
|
||||
- Type: Feature
|
||||
- Contributor: KamioRinn
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 model now supports LoRA training, requiring 8GB GPU Memory for fine-tuning.**
|
||||
- Type: New Feature
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e)
|
||||
- Content: **GPT-SoVITS V3 model now supports LoRA training, requiring 8GB GPU Memory for fine-tuning.**
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): Added Mel Band Roformer model support for vocal and Instrument separation.
|
||||
- Type: New Feature
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078)
|
||||
- Content: Added Mel Band Roformer model support for vocal and Instrument separation.
|
||||
- Type: Feature
|
||||
- Contributor: Sucial
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): Fixed MeCab error under Chinese paths (specifically for Japanese/Korean or multilingual text splitting).
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114)
|
||||
- Content: Fixed MeCab error under Chinese paths (specifically for Japanese/Korean or multilingual text splitting).
|
||||
- Type: Fix
|
||||
- Contributor: KamioRinn
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **Added 24kHz to 48kHz audio super-resolution models** to alleviate the "muffled" audio issue when generating 24K audio with V3 model.
|
||||
- Type: New Feature
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc)
|
||||
- Content: **Added 24kHz to 48kHz audio super-resolution models** to alleviate the "muffled" audio issue when generating 24K audio with V3 model.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- Related: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): Updated multilingual project documentation.
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123)
|
||||
- Content: Updated multilingual project documentation.
|
||||
- Type: Documentation
|
||||
- Contributor: StaryLan
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): Applied rule-based detection for short CJK characters when model cannot identify them.
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122)
|
||||
- Content: Applied rule-based detection for short CJK characters when model cannot identify them.
|
||||
- Type: Fix
|
||||
- Contributor: KamioRinn
|
||||
- Related: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116)
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): Added speech rate parameter to control synthesis speed.
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5)
|
||||
- Content: Added speech rate parameter to control synthesis speed.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2025.02.28 **Officially released GPT-SoVITS V3**.
|
||||
|
||||
## 202503
|
||||
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): Fixed issues caused by incorrect versions of dependencies.
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236)
|
||||
- Content: Fixed issues caused by incorrect versions of dependencies.
|
||||
- Type: Fix
|
||||
- Contributor: XXXXRT666
|
||||
- Related:
|
||||
@@ -264,8 +474,9 @@
|
||||
- ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841).
|
||||
- Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239).
|
||||
- PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174).
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **Enabled parallel inference for SoVITS v3.**
|
||||
- Type: New Feature
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241)
|
||||
- Content: **Enabled parallel inference for SoVITS v3.**
|
||||
- Type: Feature
|
||||
- Contributor: ChasonJiang
|
||||
|
||||
- Fixed other minor bugs.
|
||||
@@ -278,56 +489,92 @@
|
||||
|
||||
## 202504 (V4 Version)
|
||||
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): Unlocked SoVITS v3 parallel inference; fixed asynchronous model loading logic.
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f)
|
||||
- Content: Unlocked SoVITS v3 parallel inference; fixed asynchronous model loading logic.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Code formatting using Ruff; updated G2PW link.
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255)
|
||||
- Content: Code formatting using Ruff; updated G2PW link.
|
||||
- Type: Style
|
||||
- Contributor: XXXXRT666
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): Cleaned up documentation; added Python 3.11 support; updated installers.
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290)
|
||||
- Content: Cleaned up documentation; added Python 3.11 support; updated installers.
|
||||
- Type: Chore
|
||||
- Contributor: XXXXRT666
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Updated Colab, installation files, and model downloads.
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300)
|
||||
- Content: Updated Colab, installation files, and model downloads.
|
||||
- Type: Chore
|
||||
- Contributor: XXXXRT666
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **Added GPT-SoVITS V4 model.**
|
||||
- Type: New Feature
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf)
|
||||
- Content: **Added GPT-SoVITS V4 model.**
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): Enabled parallel inference for V4.
|
||||
- Type: New Feature
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307)
|
||||
- Content: Enabled parallel inference for V4.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): Fixed model version parameter passing.
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309)
|
||||
- Content: Fixed model version parameter passing.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): Fixed Numpy and Numba version mismatch issue; updated librosa version.
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310)
|
||||
- Content: Fixed Numpy and Numba version mismatch issue; updated librosa version.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss, XXXXRT666
|
||||
- Related: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308)
|
||||
- **2024.04.22 Officially released GPT-SoVITS V4**.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Updated Gradio parameters.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311)
|
||||
- Content: Updated Gradio parameters.
|
||||
- Type: Chore
|
||||
- Contributor: XXXXRT666
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Improved Colab/Kaggle notebook scripts.
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322)
|
||||
- Content: Improved Colab/Kaggle notebook scripts.
|
||||
- Type: Chore
|
||||
- Contributor: XXXXRT666
|
||||
|
||||
## 202505
|
||||
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): Improved Docker and Windows auto-build scripts; added pre-commit formatting.
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351)
|
||||
- Content: Improved Docker and Windows auto-build scripts; added pre-commit formatting.
|
||||
- Type: Chore
|
||||
- Contributor: XXXXRT666
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): Optimized multilingual text splitting and recognition logic.
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408)
|
||||
- Content: Optimized multilingual text splitting and recognition logic.
|
||||
- Type: Fix
|
||||
- Contributor: KamioRinn
|
||||
- Related: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404)
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): Implemented caching strategies to improve SoVITS V3/V4 inference speed by 10%.
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377)
|
||||
- Content: Implemented caching strategies to improve SoVITS V3/V4 inference speed by 10%.
|
||||
- Type: Performance Optimization
|
||||
- Contributor: Kakaru Hayate
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): Updated the annotation interface with a reminder: click Submit Text after completing each page, or changes will not be saved.
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba)
|
||||
- Content: Updated the annotation interface with a reminder: click Submit Text after completing each page, or changes will not be saved.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): Fixed UVR5 and ONNX dereverberation model errors when FFmpeg encodes MP3/M4A files with spaces in original paths.
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc)
|
||||
- Content: Fixed UVR5 and ONNX dereverberation model errors when FFmpeg encodes MP3/M4A files with spaces in original paths.
|
||||
- Type: Fix
|
||||
- Contributor: RVC-Boss
|
||||
|
||||
**Preview: Major optimization update based on V2 version coming after the Dragon Boat Festival!**
|
||||
## 202506 (V2Pro Series)
|
||||
|
||||
- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420)
|
||||
- Content: Updated multilingual project documentation.
|
||||
- Type: Documentation
|
||||
- Contributor: StaryLan
|
||||
- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417)
|
||||
- Content: Support exporting V4 with TorchScript.
|
||||
- Type: Feature
|
||||
- Contributor: L-jasmine
|
||||
- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70)
|
||||
- Content: **Added GPT-SoVITS V2Pro Series model (V2Pro, V2ProPlus).**.
|
||||
- Type: Feature
|
||||
- Contributor: RVC-Boss
|
||||
- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426)
|
||||
- Description: Fix initialization error in `config/inference_webui`.
|
||||
- Type: Fix
|
||||
- Contributor: StaryLan
|
||||
- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434)
|
||||
- Content: Optimized automatic precision detection logic; added collapsible functionality to WebUI frontend modules.
|
||||
- Type: New Feature
|
||||
- Contributors: XXXXRT666, RVC-Boss
|
||||
|
||||
@@ -1,261 +1,472 @@
|
||||
# 更新履歴
|
||||
|
||||
## 20240121
|
||||
## 202401
|
||||
|
||||
1. `config`に`is_share`を追加し、Colab などの環境でこれを`True`に設定すると、webui を公共ネットワークにマッピングできます.
|
||||
2. WebUI に英語システムの英語翻訳を追加しました.
|
||||
3. `cmd-asr`は FunASR モデルが既に含まれているかどうかを自動的に確認し、デフォルトのパスにない場合は modelscope から自動的にダウンロードします.
|
||||
4. [SoVITS 训练报错 ZeroDivisionError](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) 修復を試みます (長さ 0 のサンプルをフィルタリングなど)
|
||||
5. TEMP ファイルフォルダからオーディオやその他のファイルをクリーンアップして最適化します.
|
||||
6. 合成オーディオがリファレンスオーディオの終わりを含む問題を大幅に改善しました.
|
||||
- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108)
|
||||
- 内容: WebUIに英語システム翻訳サポートを追加。
|
||||
- タイプ: ドキュメンテーション
|
||||
- 貢献者: D3lik
|
||||
- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e)
|
||||
- 内容: SoVITSトレーニングのZeroDivisionError修正を試みた。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss, Tybost
|
||||
- 関連: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)
|
||||
- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3)
|
||||
- 内容: 合成音声に参照音声の終端が含まれる問題を大幅に軽減。
|
||||
- タイプ: 最適化
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef)
|
||||
- 内容: `cmd-asr.py`がデフォルトディレクトリにFunASRモデルが含まれているか確認し、ない場合はModelScopeからダウンロードするようになった。
|
||||
- タイプ: 機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d)
|
||||
- 内容: `Config.py`に`is_share`パラメータを追加、`True`に設定するとWebUIを公開ネットワークにマッピング可能。
|
||||
- タイプ: 機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f)
|
||||
- 内容: `TEMP`フォルダ内のキャッシュ音声ファイルやその他ファイルをクリーンアップ。
|
||||
- タイプ: 最適化
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68)
|
||||
- 内容: 極端に短い出力ファイルで参照音声が繰り返される問題を修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.22 英語と日本語トレーニングのネイティブサポートをテスト(日本語トレーニングはルートディレクトリに非英語特殊文字がないことが必要)。
|
||||
- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124)
|
||||
- 内容: 音声パスチェックを改善。不正な入力パスから読み取ろうとすると、ffmpegエラーではなくパスが存在しないと報告するようになった。
|
||||
- タイプ: 最適化
|
||||
- 貢献者: xmimu
|
||||
- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1)
|
||||
- 内容: Hubert抽出がNaNエラーを引き起こし、SoVITS/GPTトレーニングでZeroDivisionErrorが発生する問題を解決。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50)
|
||||
- 内容: 中国語分ツール`jieba`を`jieba_fast`に置き換え。
|
||||
- タイプ: 最適化
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc)
|
||||
- 内容: モデルファイルのソートロジックを最適化。
|
||||
- タイプ: 最適化
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f)
|
||||
- 内容: 推論WebUIでクイックモデル切り替えをサポート追加。
|
||||
- タイプ: 機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b)
|
||||
- 内容: 推論WebUIの冗長なログを削除。
|
||||
- タイプ: 最適化
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200)
|
||||
- 内容: Macでのトレーニングと推論をサポート。
|
||||
- タイプ: 機能
|
||||
- 貢献者: Lion-Wu
|
||||
- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b)
|
||||
- 内容: UVR5の読み取り時にディレクトリが自動的に飛び出す問題を修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204)
|
||||
- 内容: 中日混合および日英混合出力テキストをサポート追加。
|
||||
- タイプ: 機能
|
||||
- 貢献者: Kakaru Hayate
|
||||
- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7)
|
||||
- 内容: 出力のセグメンテーションモードをオプションで追加。
|
||||
- タイプ: 機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180)
|
||||
- 内容: 複数改行による推論エラーを修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b)
|
||||
- 内容: 半精度をサポートしないGPU向けに自動的に単精度を強制。CPU推論時も単精度を強制。
|
||||
- タイプ: 最適化
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238)
|
||||
- 内容: Dockerfile内のモデルダウンロードプロセスを完了。
|
||||
- タイプ: 修正
|
||||
- 貢献者: breakstring
|
||||
- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257)
|
||||
- 内容: 数字の発音が中国語文字に変換される問題を修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: duliangang
|
||||
- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683)
|
||||
- 内容: GPTトレーニングがチェックポイントを保存しない問題を修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8)
|
||||
- 内容: 制限を設定して不合理な参照音声長を除外。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3)
|
||||
- 内容: 文頭の数文字が飲み込まれる問題を修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0)
|
||||
- 内容: 16シリーズのような半精度トレーニングに問題があるGPU向けに、トレーニング設定を単精度に変更。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec)
|
||||
- 内容: 利用可能なColabバージョンをテストして更新。
|
||||
- タイプ: 機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135)
|
||||
- 内容: FunASRをバージョン1.0に更新し、インターフェース不一致によるエラーを修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: LauraGPT
|
||||
- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4)
|
||||
- 内容: 中日英句読点の分割問題を修正し、文の始めと終わりに句読点を追加。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2)
|
||||
- 内容: 句読点による分割を追加。
|
||||
- タイプ: 機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7)
|
||||
- 内容: パスと関連する文字列を解析して、二重引用符を自動的に削除します.また、パスをコピーする場合、二重引用符が含まれていてもエラーが発生しません.
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
|
||||
## 20240122
|
||||
## 202402
|
||||
|
||||
1. 短すぎる出力ファイルが重複したリファレンスオーディオを返す問題を修正しました.
|
||||
2. 英語-日本語学習がスムーズに進む QA を完了しました. (ただし、日本語学習はルートディレクトリに英語以外の文字が含まれていない必要があります)
|
||||
3. オーディオパスをチェックします.間違ったパスを読み取ろうとすると、「パスが存在しません」というエラーメッセージが返されます.これは ffmpeg モジュールのエラーではありません.
|
||||
- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6)
|
||||
- 内容: ASRパス末尾のスラッシュによるファイル名保存エラーの修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7)
|
||||
- 内容: UVR5のフォーマット読み取りエラーによる音声分離失敗の修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7)
|
||||
- 内容: 中日英混合テキストの自動言語判別・分割機能のサポート
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377)
|
||||
- 内容: PaddleSpeechのテキスト正規化を導入(例: xx.xx%表記、「元/吨」を「元每吨」と正確に読む、アンダースコア問題の解消)
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: KamioRinn
|
||||
- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395)
|
||||
- 内容: 英語テキスト前処理の最適化
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: KamioRinn
|
||||
- 2024.02.06 [Commit#65b463a7](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927)
|
||||
- 内容: 言語パラメータの混乱による中国語推論精度低下の修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 関連: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)
|
||||
- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403)
|
||||
- 内容: UVR5の高バージョンLibrosaへの対応
|
||||
- タイプ: 修正
|
||||
- 貢献者: StaryLan
|
||||
- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)
|
||||
- 内容: UVR5の「inf everywhere」エラーの修正(ブール型変換不足による半精度推論問題、16シリーズGPUで発生)
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2)
|
||||
- 内容: Gradio依存関係の修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400)
|
||||
- 内容: Faster Whisperの統合による日本語・英語音声認識機能の追加
|
||||
- タイプ: 新機能
|
||||
- 貢献者: Shadow
|
||||
- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10)
|
||||
- 内容: 3連ルートディレクトリ空欄時の自動.listファイルパス読み込み機能
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)
|
||||
- 内容: GPTトレーニングのフリーズ問題(Windows10 1909)と繁体字システム言語時のエラー修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 関連: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232)
|
||||
- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)
|
||||
- 内容: DPO損失実験的トレーニングオプションの追加(ネガティブサンプル構築によるGPTの繰り返し・文字抜け問題改善)、推論インターフェースの複数パラメータ公開
|
||||
- タイプ: 新機能
|
||||
- 貢献者: liufenghua
|
||||
- 2024.02.12 [Commit#2fa74ecb](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#d82f6bbb](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28)
|
||||
- 内容: 音声認識ロジックの最適化、Faster Whisperのミラーサイトダウンロード対応(HuggingFace接続問題回避)
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.15 [Commit#dd2c4d6d](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8)
|
||||
- 内容: 中国語実験名のトレーニングサポート
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b)
|
||||
- 内容: DPOトレーニングを必須からオプションに変更(選択時は自動的にバッチサイズ半減)、推論インターフェースの新パラメータ未伝達問題の修正
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5)
|
||||
- 内容: 中国語テキスト前処理エラーの修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499)
|
||||
- 内容: 参照テキストなし入力のサポート
|
||||
- タイプ: 新機能
|
||||
- 貢献者: Watchtower-Liu
|
||||
- 関連: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475)
|
||||
- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559)
|
||||
- 内容: 中国語・日本語前処理の改善
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: KamioRinn, v3cun
|
||||
- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511)
|
||||
- 内容: Colabの公開URL未開始問題の修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: ChanningWang2018, RVC-Boss
|
||||
- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557)
|
||||
- 内容: MacOS推論デバイスをMPSからCPUに変更(CPU推論の方が高速)
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#5a171773](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35)
|
||||
- 内容: データ前処理に音声ノイズ除去オプション追加(16Kサンプルレートにダウンサンプリング、高ノイズ時以外は非推奨)
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573)
|
||||
- 内容: is_half判定の修正によるMacOSの正常なCPU推論対応
|
||||
- タイプ: 修正
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610)
|
||||
- 内容: UVR5 MDXNetパラメータ順序エラーによる出力フォルダ逆転問題の修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: Yuze Wang
|
||||
|
||||
## 20240123
|
||||
## 202403
|
||||
|
||||
1. hubert から nan 抽出による SoVITS/GPT 学習中の ZeroDivisionError 関連エラーを修正しました.
|
||||
2. 推論インターフェースでモデルを素早く切り替えることができるようにサポートしました.
|
||||
3. モデルファイルのソートロジックを最適化しました.
|
||||
4. 中国語の分析に `jieba_fast` を `jieba` に置き換えました.
|
||||
- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675)
|
||||
- 内容: CUDAが利用できない場合、Faster Whisperの自動CPU推論を有効化
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: ShiroDoMain
|
||||
- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193)
|
||||
- 内容: Faster Whisper非中国語ASR使用時、中国語FunASRモデルの事前ダウンロードが不要に
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- 内容: 推論速度を50%向上(RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39環境で検証)
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: GoHomeToMacDonal
|
||||
- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721)
|
||||
- 内容: 高速推論ブランチ`fast_inference_`を追加
|
||||
- タイプ: 新機能
|
||||
- 貢献者: ChasonJiang
|
||||
- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761)
|
||||
- 内容: CPUトレーニングをサポート(macOSでCPUを使用したトレーニングが可能に)
|
||||
- タイプ: 新機能
|
||||
- 貢献者: Lion-Wu
|
||||
- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821)
|
||||
- 内容: 英語テキストフロントエンドの最適化
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: KamioRinn
|
||||
- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894)
|
||||
- 内容: APIフォーマットの改善
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: KamioRinn
|
||||
|
||||
## 20240126
|
||||
## 202404
|
||||
|
||||
1. 中国語と英語、日本語と英語が混在した出力テキストをサポートします.
|
||||
2. 出力で選択的な分割モードをサポートします.
|
||||
3. uvr5 がディレクトリを読み取り、自動的に終了する問題を修正しました.
|
||||
4. 複数の改行による推論エラーを修正しました.
|
||||
5. 推論インターフェースから不要なログを削除しました.
|
||||
6. MacOS での学習と推論をサポートします.
|
||||
7. 半精度をサポートしていないカードを自動的に識別して単精度を強制し、CPU 推論では単精度を強制します.
|
||||
- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917)
|
||||
- 内容: UVR5 WebUIにおけるFFmpegコマンド文字列フォーマットの修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: StaryLan
|
||||
|
||||
## 20240128
|
||||
## 202405
|
||||
|
||||
1. 数字を漢字で読む問題を修正しました.
|
||||
2. 文章の先頭の一部の単語が欠落する問題を修正しました.
|
||||
3. 不適切な長さのリファレンスオーディオを制限しました.
|
||||
4. GPT 学習時の ckpt が保存されない問題を修正しました.
|
||||
5. Dockerfile のモデルダウンロードプロセスを改善しました.
|
||||
- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953)
|
||||
- 内容: SoVITSトレーニング時のVQ凍結漏れ問題を修正(品質劣化の原因となる)
|
||||
- タイプ: 修正
|
||||
- 貢献者: hcwu1993
|
||||
- 関連: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747)
|
||||
- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102)
|
||||
- 内容: トレーニングデータ処理時、未対応言語に対するエラープロンプトを追加
|
||||
- タイプ: 機能改善
|
||||
- 貢献者: StaryLan
|
||||
- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132)
|
||||
- 内容: Hubert抽出におけるバグ修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: XXXXRT666
|
||||
|
||||
## 20240129
|
||||
## 202406
|
||||
|
||||
1. 16 系などの半精度学習に問題があるカードは、学習構成を単精度学習に変更しました.
|
||||
2. Colab でも使用可能なバージョンをテストして更新しました.
|
||||
3. ModelScope FunASR リポジトリの古いバージョンで git クローンを行う際のインターフェース不整合エラーの問題を修正しました.
|
||||
- 2024.06.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a)
|
||||
- 内容: WebUIのGPTファインチューニング時に中国語入力テキストのBERT特徴量を読み取れない問題を修正(推論時との不一致や品質劣化の原因となる)
|
||||
**注意: 既に大量データでファインチューニング済みの場合は、品質向上のためモデルの再チューニングを推奨**
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159)
|
||||
- 内容: `s2_train.py`におけるSoVITSトレーニングの進捗バー処理を修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: pengzhendong
|
||||
- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232)
|
||||
- 内容: UVR5 MDXNetがFFmpegを呼び出す際の文字列フォーマットを修正(スペースを含むパスに対応)
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169)
|
||||
- 内容: 純粋な句読点および複数句読点テキスト入力の処理ロジックを改善
|
||||
- タイプ: 修正
|
||||
- 貢献者: XXXXRT666
|
||||
- 関連: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165)
|
||||
- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041)
|
||||
- 内容: CPU推論におけるデフォルトバッチサイズの小数点問題を修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267)
|
||||
- 内容: ノイズ除去やASRで例外が発生した場合に保留中の全オーディオファイル処理が終了してしまう問題を修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca)
|
||||
- 内容: マルチGPUトレーニング時のマルチプロセス保存ロジックを修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251)
|
||||
- 内容: 冗長な`my_utils.py`を削除
|
||||
- タイプ: 最適化
|
||||
- 貢献者: aoguai
|
||||
- 関連: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189)
|
||||
|
||||
## 20240130
|
||||
## 202407
|
||||
|
||||
1. パスと関連する文字列を解析して、二重引用符を自動的に削除します.また、パスをコピーする場合、二重引用符が含まれていてもエラーが発生しません.
|
||||
2. 中国語と英語、日本語と英語の混合出力をサポートします.
|
||||
3. 出力で選択的な分割モードをサポートします.
|
||||
- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253)
|
||||
- 内容: 句読点分割時の小数点分割問題を修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: aoguai
|
||||
- 2024.07.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5)
|
||||
- 内容: 高速化推論コードが検証済みでmainブランチにマージされ、ベースと同等の推論効果を保証。テキスト未参照モードでも高速推論をサポート
|
||||
- タイプ: 最適化
|
||||
- 貢献者: RVC-Boss, GoHomeToMacDonal
|
||||
- 関連: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- 今後も`fast_inference`ブランチでの変更整合性を継続検証
|
||||
|
||||
## 20240201
|
||||
|
||||
1. UVR5 形式の読み取りエラーによる分離失敗を修正しました.
|
||||
2. 中国語・日本語・英語の混合テキストに対する自動分割と言語認識をサポートしました.
|
||||
|
||||
## 20240202
|
||||
|
||||
1. ASRパスが `/` で終わることによるファイル名保存エラーの問題を修正しました.
|
||||
2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) で PaddleSpeech の Normalizer を導入し、"xx.xx%" (パーセント記号) の読み取りや"元/吨"が"元吨"ではなく"元每吨"と読まれる問題、アンダースコアエラーを修正しました.
|
||||
|
||||
## 20240207
|
||||
|
||||
1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) で報告された中国語推論品質の低下を引き起こした言語パラメータの混乱を修正しました.
|
||||
2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) で UVR5 を librosa のより高いバージョンに適応させました.
|
||||
3. [Commit 14a2851](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) で、`is_half` パラメータがブール値に変換されず、常に半精度推論が行われ、16 シリーズの GPU で `inf` が発生する UVR5 inf everywhereエラーを修正しました.
|
||||
4. 英語テキストフロントエンドを最適化しました.
|
||||
5. Gradio の依存関係を修正しました.
|
||||
6. データセット準備中にルートディレクトリが空白の場合、`.list` フルパスの自動読み取りをサポートしました.
|
||||
7. 日本語と英語のために Faster Whisper ASR を統合しました.
|
||||
|
||||
## 20240208
|
||||
|
||||
1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) で、Windows 10 1909 および [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) (繁体字中国語システム言語) での GPT トレーニングのハングを修正する試みを行いました.
|
||||
|
||||
## 20240212
|
||||
|
||||
1. Faster Whisper と FunASR のロジックを最適化し、Faster Whisper をミラーダウンロードに切り替えて Hugging Face の接続問題を回避しました.
|
||||
2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) で、GPT の繰り返しと文字欠落を軽減するために、トレーニング中に負のサンプルを構築する実験的なDPO Lossトレーニングオプションを有効にし、いくつかの推論パラメータを推論WebUIで利用可能にしました.
|
||||
|
||||
## 20240214
|
||||
|
||||
1. トレーニングで中国語の実験名をサポート (以前はエラーが発生していました).
|
||||
2. DPOトレーニングを必須ではなくオプション機能に変更.選択された場合、バッチサイズは自動的に半分になります.推論 WebUI で新しいパラメータが渡されない問題を修正しました.
|
||||
|
||||
## 20240216
|
||||
|
||||
1. 参照テキストなしでの入力をサポート.
|
||||
2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) で報告された中国語フロントエンドのバグを修正しました.
|
||||
|
||||
## 20240221
|
||||
|
||||
1. データ処理中のノイズ低減オプションを追加 (ノイズ低減は16kHzサンプリングレートのみを残します;背景ノイズが大きい場合にのみ使用してください).
|
||||
2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) で中国語と日本語のフロントエンド処理を最適化しました.
|
||||
3. Mac CPU 推論を MPS ではなく CPU を使用するように切り替え、パフォーマンスを向上させました.
|
||||
4. Colab のパブリック URL の問題を修正しました.
|
||||
## 20240306
|
||||
|
||||
1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) で推論速度を50%向上させました (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 でテスト).
|
||||
2. Faster Whisper非中国語ASRを使用する際、最初に中国語FunASRモデルをダウンロードする必要がなくなりました.
|
||||
3. [PR 610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) で UVR5 残響除去モデルの設定が逆になっていた問題を修正しました.
|
||||
4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) で、CUDA が利用できない場合に Faster Whisper の自動 CPU 推論を有効にしました.
|
||||
5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) で、Mac での適切なCPU推論を確保するために `is_half` チェックを修正しました.
|
||||
|
||||
## 202403/202404/202405
|
||||
|
||||
### マイナー修正:
|
||||
|
||||
1. 参照テキストなしモードの問題を修正しました.
|
||||
2. 中国語と英語のテキストフロントエンドを最適化しました.
|
||||
3. API フォーマットを改善しました.
|
||||
4. CMD フォーマットの問題を修正しました.
|
||||
5. トレーニングデータ処理中のサポートされていない言語に対するエラープロンプトを追加しました.
|
||||
6. Hubert 抽出のバグを修正しました.
|
||||
|
||||
### メジャー修正:
|
||||
|
||||
1. SoVITS トレーニングで VQ を凍結せずに品質低下を引き起こす問題を修正しました.
|
||||
2. クイック推論ブランチを追加しました.
|
||||
|
||||
## 20240610
|
||||
|
||||
### マイナー修正:
|
||||
|
||||
1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169)で、純粋な句読点および複数の句読点を含むテキスト入力のロジックを改善しました.
|
||||
2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232)で、UVR5 の MDXNet デリバブをサポートする CMD フォーマットを修正し、スペースを含むパスをサポートしました.
|
||||
3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159)で、`s2_train.py` の SoVITS トレーニングのプログレスバーロジックを修正しました.
|
||||
|
||||
### メジャー修正:
|
||||
|
||||
4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) で、WebUI の GPT ファインチューニングが中国語入力テキストの BERT 特徴を読み取らず、推論との不一致や品質低下の可能性を修正しました.
|
||||
**注意: 以前に大量のデータでファインチューニングを行った場合、品質向上のためにモデルを再調整することをお勧めします.**
|
||||
|
||||
## 20240706
|
||||
|
||||
### マイナー修正:
|
||||
|
||||
1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) で、CPU 推論のデフォルトバッチサイズの小数点問題を修正しました.
|
||||
2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) で、ノイズ除去またはASRが例外に遭遇した場合に、すべての保留中のオーディオファイルが終了する問題を修正しました.
|
||||
3. [PR 1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) で、句読点で分割する際の小数点分割の問題を修正しました.
|
||||
4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) で、マルチGPUトレーニングのマルチプロセス保存ロジックを修正しました.
|
||||
5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) で、不要な `my_utils` を削除しました.
|
||||
|
||||
### メジャー修正:
|
||||
|
||||
6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) の加速推論コードが検証され、メインブランチにマージされ、ベースとの推論効果の一貫性が確保されました.
|
||||
また、参照テキストなしモードでの加速推論もサポートしています.
|
||||
|
||||
**今後の更新では、`fast_inference`ブランチの変更の一貫性を継続的に検証します**.
|
||||
|
||||
## 20240727
|
||||
|
||||
### マイナー修正:
|
||||
|
||||
1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) で、不要な i18n コードをクリーンアップしました.
|
||||
2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) で、ユーザーファイルパスの末尾のスラッシュがコマンドラインエラーを引き起こす問題を修正しました.
|
||||
3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) で、GPT トレーニングのステップ計算ロジックを修正しました.
|
||||
|
||||
### メジャー修正:
|
||||
|
||||
4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) で、合成のスピーチレート調整をサポートしました.
|
||||
スピーチレートのみを調整しながらランダム性を固定できるようになりました.
|
||||
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): BS-RoFormerボーカル・伴奏分離モデルのサポートを追加。
|
||||
- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298)
|
||||
- 内容: i18nスキャンのリファクタリングと多言語設定ファイルの更新
|
||||
- タイプ: ドキュメンテーション
|
||||
- 貢献者: StaryLan
|
||||
- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299)
|
||||
- 内容: ユーザーファイルパスの末尾スラッシュがコマンドラインエラーを引き起こす問題を修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756)
|
||||
- 内容: GPTトレーニング時、カスタム`bucket_sampler`使用時のステップ数不一致を修正
|
||||
- タイプ: 修正
|
||||
- 貢献者: huangxu1991
|
||||
- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340)
|
||||
- 内容: 合成時の話速調整をサポート(ランダム性を固定して速度のみ制御するオプション含む)。`api.py`に更新済み
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss, 红血球AE3803
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356)
|
||||
- 内容: BS-RoFormerボーカル・伴奏分離モデルのサポートを追加。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): 中国語テキストフロントエンドの改善。
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351)
|
||||
- 内容: 中国語テキストフロントエンドの改善。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: KamioRinn
|
||||
|
||||
## 202408 (V2 バージョン)
|
||||
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): WebUIでファイル処理時にパスを自動入力するように変更。
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355)
|
||||
- 内容: WebUIでファイル処理時にパスを自動入力するように変更。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): BS-RoformerのFP16推論サポートを有効化。
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c)
|
||||
- 内容: BS-RoformerのFP16推論サポートを有効化。
|
||||
- タイプ: パフォーマンス最適化
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): GPU認識ロジックを最適化、ユーザーが入力した任意のGPUインデックスを処理するユーザーフレンドリーなロジックを追加。
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78)
|
||||
- 内容: GPU認識ロジックを最適化、ユーザーが入力した任意のGPUインデックスを処理するユーザーフレンドリーなロジックを追加。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **GPT-SoVITS V2モデルを追加。**
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758)
|
||||
- 内容: **GPT-SoVITS V2モデルを追加。**
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): FunASRを使用して広東語ASRをサポート。
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3)
|
||||
- 内容: FunASRを使用して広東語ASRをサポート。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): UIとタイミングロジックを最適化。
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388)
|
||||
- 内容: UIとタイミングロジックを最適化。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): 多音字処理ロジックを最適化(V2のみ)。
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488)
|
||||
- 内容: 多音字処理ロジックを最適化(V2のみ)。
|
||||
- タイプ: 修正、新機能
|
||||
- 貢献者: KamioRinn、RVC-Boss
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): 参照音声が1つしかアップロードできないバグを修正。欠損ファイルがある場合に警告ポップアップを表示するデータセット検証を追加。
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422)
|
||||
- 内容: 参照音声が1つしかアップロードできないバグを修正。欠損ファイルがある場合に警告ポップアップを表示するデータセット検証を追加。
|
||||
- タイプ: 修正、雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): 上流のLangSegmentライブラリがSSMLタグを使用した数字、電話番号、日付、時刻の最適化をサポート。
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508)
|
||||
- 内容: 上流のLangSegmentライブラリがSSMLタグを使用した数字、電話番号、日付、時刻の最適化をサポート。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: juntaosun
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): APIを修正・最適化。
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503)
|
||||
- 内容: APIを修正・最適化。
|
||||
- タイプ: 修正
|
||||
- 貢献者: KamioRinn
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): `fast_inference`ブランチをメインブランチにマージ。
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490)
|
||||
- 内容: `fast_inference`ブランチをメインブランチにマージ。
|
||||
- タイプ: リファクタリング
|
||||
- 貢献者: ChasonJiang
|
||||
- 2024.08.21 **GPT-SoVITS V2バージョンを正式リリース。**
|
||||
|
||||
## 202502 (V3 バージョン)
|
||||
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **GPT-SoVITS V3モデルを追加。ファインチューニングには14GBのVRAMが必要。**
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4)
|
||||
- 内容: **GPT-SoVITS V3モデルを追加。ファインチューニングには14GBのVRAMが必要。**
|
||||
- タイプ: 新機能([Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7))参照)
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): 多言語プロジェクトドキュメントを更新。
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032)
|
||||
- 内容: 多言語プロジェクトドキュメントを更新。
|
||||
- タイプ: ドキュメント
|
||||
- 貢献者: StaryLan
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): 日本語ドキュメントを更新。
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033)
|
||||
- 内容: 日本語ドキュメントを更新。
|
||||
- タイプ: ドキュメント
|
||||
- 貢献者: Fyphen
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): アテンション計算ロジックを最適化。
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010)
|
||||
- 内容: アテンション計算ロジックを最適化。
|
||||
- タイプ: パフォーマンス最適化
|
||||
- 貢献者: wzy3650
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): ファインチューニング用に勾配チェックポイントサポートを追加。12GB VRAMが必要。
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040)
|
||||
- 内容: ファインチューニング用に勾配チェックポイントサポートを追加。12GB VRAMが必要。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: Kakaru Hayate
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): 新しい言語セグメンテーションツールに切り替え、多言語混合テキストの分割戦略を改善。数字と英語の処理ロジックを最適化。
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073)
|
||||
- 内容: 新しい言語セグメンテーションツールに切り替え、多言語混合テキストの分割戦略を改善。数字と英語の処理ロジックを最適化。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: KamioRinn
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3モデルがLoRAトレーニングをサポート。ファインチューニングに8GB GPUメモリが必要。**
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e)
|
||||
- 内容: **GPT-SoVITS V3モデルがLoRAトレーニングをサポート。ファインチューニングに8GB GPUメモリが必要。**
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): ボーカルと楽器分離のためのMel Band Roformerモデルサポートを追加。
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078)
|
||||
- 内容: ボーカルと楽器分離のためのMel Band Roformerモデルサポートを追加。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: Sucial
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): 中国語パス下でのMeCabエラーを修正(日本語/韓国語または多言語テキスト分割用)。
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114)
|
||||
- 内容: 中国語パス下でのMeCabエラーを修正(日本語/韓国語または多言語テキスト分割用)。
|
||||
- タイプ: 修正
|
||||
- 貢献者: KamioRinn
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **24kHzから48kHzへのオーディオ超解像モデルを追加**。V3モデルで24Kオーディオを生成する際の「こもった」オーディオ問題を緩和。
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc)
|
||||
- 内容: **24kHzから48kHzへのオーディオ超解像モデルを追加**。V3モデルで24Kオーディオを生成する際の「こもった」オーディオ問題を緩和。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 関連: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): 多言語プロジェクトドキュメントを更新。
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123)
|
||||
- 内容: 多言語プロジェクトドキュメントを更新。
|
||||
- タイプ: ドキュメント
|
||||
- 貢献者: StaryLan
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): モデルが識別できない短いCJK文字に対してルールベースの検出を適用。
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122)
|
||||
- 内容: モデルが識別できない短いCJK文字に対してルールベースの検出を適用。
|
||||
- タイプ: 修正
|
||||
- 貢献者: KamioRinn
|
||||
- 関連: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116)
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): 合成速度を制御するための発話速度パラメータを追加。
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5)
|
||||
- 内容: 合成速度を制御するための発話速度パラメータを追加。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.02.28 **GPT-SoVITS V3を正式リリース**。
|
||||
|
||||
## 202503
|
||||
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): 依存関係の不正なバージョンによる問題を修正。
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236)
|
||||
- 内容: 依存関係の不正なバージョンによる問題を修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: XXXXRT666
|
||||
- 関連:
|
||||
@@ -263,7 +474,8 @@
|
||||
- ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841).
|
||||
- Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239).
|
||||
- PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174).
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **SoVITS v3の並列推論を有効化。**
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241)
|
||||
- 内容: **SoVITS v3の並列推論を有効化。**
|
||||
- タイプ: 新機能
|
||||
- 貢献者: ChasonJiang
|
||||
|
||||
@@ -277,56 +489,92 @@
|
||||
|
||||
## 202504 (V4 バージョン)
|
||||
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): SoVITS v3並列推論のロックを解除。非同期モデル読み込みロジックを修正。
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f)
|
||||
- 内容: SoVITS v3並列推論のロックを解除。非同期モデル読み込みロジックを修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruffを使用したコードフォーマット。G2PWリンクを更新。
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255)
|
||||
- 内容: Ruffを使用したコードフォーマット。G2PWリンクを更新。
|
||||
- タイプ: スタイル
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): ドキュメントを整理。Python 3.11サポートを追加。インストーラーを更新。
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290)
|
||||
- 内容: ドキュメントを整理。Python 3.11サポートを追加。インストーラーを更新。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Colab、インストールファイル、モデルダウンロードを更新。
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300)
|
||||
- 内容: Colab、インストールファイル、モデルダウンロードを更新。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **GPT-SoVITS V4モデルを追加。**
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf)
|
||||
- 内容: **GPT-SoVITS V4モデルを追加。**
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): V4の並列推論を有効化。
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307)
|
||||
- 内容: V4の並列推論を有効化。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss、ChasonJiang
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): モデルバージョンパラメータの受け渡しを修正。
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309)
|
||||
- 内容: モデルバージョンパラメータの受け渡しを修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss、ChasonJiang
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): NumpyとNumbaのバージョン不一致問題を修正。librosaバージョンを更新。
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310)
|
||||
- 内容: NumpyとNumbaのバージョン不一致問題を修正。librosaバージョンを更新。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss、XXXXRT666
|
||||
- 関連: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308)
|
||||
- **2024.04.22 GPT-SoVITS V4を正式リリース**。
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Gradioパラメータを更新。
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311)
|
||||
- 内容: Gradioパラメータを更新。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Colab/Kaggleノートブックスクリプトを改善。
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322)
|
||||
- 内容: Colab/Kaggleノートブックスクリプトを改善。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
|
||||
## 202505
|
||||
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): DockerとWindows自動ビルドスクリプトを改善。pre-commitフォーマットを追加。
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351)
|
||||
- 内容: DockerとWindows自動ビルドスクリプトを改善。pre-commitフォーマットを追加。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): 多言語テキスト分割と認識ロジックを最適化。
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408)
|
||||
- 内容: 多言語テキスト分割と認識ロジックを最適化。
|
||||
- タイプ: 修正
|
||||
- 貢献者: KamioRinn
|
||||
- 関連: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404)
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): キャッシュ戦略を実装し、SoVITS V3/V4推論速度を10%向上。
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377)
|
||||
- 内容: キャッシュ戦略を実装し、SoVITS V3/V4推論速度を10%向上。
|
||||
- タイプ: パフォーマンス最適化
|
||||
- 貢献者: Kakaru Hayate
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): アノテーションインターフェースを更新し、以下の注意事項を追加しました:各ページの編集が終わったら必ず「Submit Text」をクリックしてください。さもなくば変更は保存されません。
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba)
|
||||
- 内容: アノテーションインターフェースを更新し、以下の注意事項を追加しました:各ページの編集が終わったら必ず「Submit Text」をクリックしてください。さもなくば変更は保存されません。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): UVR5およびONNX dereverberationモデルのエラーを修正。FFmpegが元のパスにスペースを含むMP3/M4Aファイルをエンコードする場合の問題を解決。
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc)
|
||||
- 内容: UVR5およびONNX dereverberationモデルのエラーを修正。FFmpegが元のパスにスペースを含むMP3/M4Aファイルをエンコードする場合の問題を解決。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
|
||||
**プレビュー: 端午節後にV2バージョンを基にした大規模な最適化アップデートを予定!**
|
||||
## 202506(V2Pro シリーズ)
|
||||
|
||||
- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420)
|
||||
- 内容: プロジェクトの多言語ドキュメントを更新
|
||||
- タイプ: ドキュメント
|
||||
- 貢献者: StaryLan
|
||||
- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417)
|
||||
- 内容: TorchScript を使用した V4 モデルのエクスポート機能を追加
|
||||
- タイプ: 新機能
|
||||
- 貢献者: L-jasmine
|
||||
- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)〜[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70)
|
||||
- 内容: GPT-SoVITS V2Pro シリーズモデル (V2Pro, V2ProPlus) を正式に導入
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426)
|
||||
- 内容: `config/inference_webui` の初期化時のエラーを修正
|
||||
- タイプ: 不具合修正(Bug Fix)
|
||||
- 貢献者: StaryLan
|
||||
- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434)
|
||||
- 内容: 自動精度検出ロジックを最適化し、WebUI フロントエンドモジュールに折り畳み(Collapsible)機能を追加
|
||||
- タイプ: 新機能
|
||||
- 貢献者: XXXXRT666, RVC-Boss
|
||||
|
||||
@@ -299,6 +299,38 @@ v2 環境から v3 を使用する方法:
|
||||
|
||||
追加: 音声超解像モデルについては、[ダウンロード方法](../../tools/AP_BWE_main/24kto48k/readme.txt)を参照してください.
|
||||
|
||||
## V4 リリースノート
|
||||
|
||||
新機能:
|
||||
|
||||
1. **V4 は、V3 で発生していた非整数倍アップサンプリングによる金属音の問題を修正し、音声がこもる問題を防ぐためにネイティブに 48kHz 音声を出力します(V3 はネイティブに 24kHz 音声のみ出力)**. 作者は V4 を V3 の直接的な置き換えとして推奨していますが、さらなるテストが必要です.
|
||||
[詳細はこちら](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3v4%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7))
|
||||
|
||||
V1/V2/V3 環境から V4 への移行方法:
|
||||
|
||||
1. `pip install -r requirements.txt` を実行して一部の依存パッケージを更新してください.
|
||||
|
||||
2. GitHub から最新のコードをクローンします.
|
||||
|
||||
3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) から V4 の事前学習済みモデル (`gsv-v4-pretrained/s2v4.ckpt` および `gsv-v4-pretrained/vocoder.pth`) をダウンロードし、`GPT_SoVITS/pretrained_models` ディレクトリへ配置してください.
|
||||
|
||||
## V2Pro リリースノート
|
||||
|
||||
新機能:
|
||||
|
||||
1. **V2 と比較してやや高いメモリ使用量ですが、ハードウェアコストと推論速度は維持しつつ、V4 よりも高い性能と音質を実現します. **
|
||||
[詳細はこちら](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90features-(%E5%90%84%E7%89%88%E6%9C%AC%E7%89%B9%E6%80%A7))
|
||||
|
||||
2. V1/V2 と V2Pro シリーズは類似した特徴を持ち、V3/V4 も同様の機能を持っています. 平均音質が低いトレーニングセットの場合、V1/V2/V2Pro は良好な結果を出すことができますが、V3/V4 では対応できません. また、V3/V4 の合成音声はトレーニング全体ではなく、より参考音声に寄った音質になります.
|
||||
|
||||
V1/V2/V3/V4 環境から V2Pro への移行方法:
|
||||
|
||||
1. `pip install -r requirements.txt` を実行して一部の依存パッケージを更新してください.
|
||||
|
||||
2. GitHub から最新のコードをクローンします.
|
||||
|
||||
3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) から V2Pro の事前学習済みモデル (`v2Pro/s2Dv2Pro.pth`, `v2Pro/s2Gv2Pro.pth`, `v2Pro/s2Dv2ProPlus.pth`, `v2Pro/s2Gv2ProPlus.pth`, および `sv/pretrained_eres2netv2w24s4ep4.ckpt`) をダウンロードし、`GPT_SoVITS/pretrained_models` ディレクトリへ配置してください.
|
||||
|
||||
## Todo リスト
|
||||
|
||||
- [x] **優先度 高:**
|
||||
@@ -381,6 +413,7 @@ python ./tools/asr/fasterwhisper_asr.py -i <input> -o <output> -l <language> -p
|
||||
- [Chinese Speech Pretrain](https://github.com/TencentGameMate/chinese_speech_pretrain)
|
||||
- [Chinese-Roberta-WWM-Ext-Large](https://huggingface.co/hfl/chinese-roberta-wwm-ext-large)
|
||||
- [BigVGAN](https://github.com/NVIDIA/BigVGAN)
|
||||
- [eresnetv2](https://modelscope.cn/models/iic/speech_eres2netv2w24s4ep4_sv_zh-cn_16k-common)
|
||||
|
||||
### 推論用テキストフロントエンド
|
||||
|
||||
|
||||
@@ -1,262 +1,472 @@
|
||||
# 변경 내역
|
||||
|
||||
## 20240121
|
||||
## 202401
|
||||
|
||||
1. `config`에 `is_share`를 추가했습니다. Colab과 같은 시나리오에서는 이 값을 `True`로 설정하여 WebUI를 공개 네트워크에 매핑할 수 있습니다.
|
||||
2. WebUI에 영어 시스템 번역 지원을 추가했습니다.
|
||||
3. `cmd-asr`이 FunASR 모델이 포함되어 있는지 자동으로 감지합니다; 기본 디렉토리에서 찾을 수 없으면 ModelScope에서 다운로드됩니다.
|
||||
4. [Issue 79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)에서 보고된 SoVITS 훈련의 ZeroDivisionError를 필터링 샘플 등으로 해결하려고 시도했습니다.
|
||||
5. `TEMP` 폴더의 캐시된 오디오 파일 및 기타 파일을 정리했습니다.
|
||||
6. 참조 오디오의 끝이 포함된 합성 오디오 문제를 크게 줄였습니다.
|
||||
- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108)
|
||||
- 내용: WebUI에 영어 시스템 번역 지원 추가.
|
||||
- 유형: 문서화
|
||||
- 기여자: D3lik
|
||||
- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e)
|
||||
- 내용: SoVITS 학습 시 ZeroDivisionError 수정 시도.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss, Tybost
|
||||
- 관련: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)
|
||||
- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3)
|
||||
- 내용: 합성된 오디오가 참조 오디오의 끝부분을 포함하는 문제 크게 감소.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef)
|
||||
- 내용: `cmd-asr.py`가 이제 FunASR 모델이 기본 디렉토리에 포함되어 있는지 확인하고, 없으면 ModelScope에서 다운로드.
|
||||
- 유형: 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d)
|
||||
- 내용: `Config.py`에 `is_share` 매개변수 추가, `True`로 설정하면 WebUI를 공용 네트워크에 매핑.
|
||||
- 유형: 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f)
|
||||
- 내용: `TEMP` 폴더에서 캐시된 오디오 파일 및 기타 파일 정리.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68)
|
||||
- 내용: 지나치게 짧은 출력 파일로 인해 참조 오디오가 반복되는 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.22 영어 및 일본어 학습의 기본 지원 테스트 (일본어 학습은 루트 디렉토리에 비영어 특수 문자가 없어야 함).
|
||||
- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124)
|
||||
- 내용: 오디오 경로 확인 개선. 잘못된 입력 경로에서 읽으려고 하면 ffmpeg 오류 대신 경로가 존재하지 않는다고 보고.
|
||||
- 유형: 최적화
|
||||
- 기여자: xmimu
|
||||
- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1)
|
||||
- 내용: Hubert 추출이 NaN 오류를 일으켜 SoVITS/GPT 학습 시 ZeroDivisionError가 발생하는 문제 해결.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50)
|
||||
- 내용: 중국어 단어 분리를 위해 `jieba`를 `jieba_fast`로 교체.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc)
|
||||
- 내용: 모델 파일 정렬 로직 최적화.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f)
|
||||
- 내용: 추론 WebUI에서 빠른 모델 전환 지원 추가.
|
||||
- 유형: 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b)
|
||||
- 내용: 추론 WebUI에서 불필요한 로그 제거.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200)
|
||||
- 내용: Mac에서의 학습 및 추론 지원.
|
||||
- 유형: 기능
|
||||
- 기여자: Lion-Wu
|
||||
- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b)
|
||||
- 내용: UVR5가 디렉토리를 읽고 자동으로 빠져나가는 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204)
|
||||
- 내용: 중국어-영어 혼합 및 일본어-영어 혼합 출력 텍스트 지원 추가.
|
||||
- 유형: 기능
|
||||
- 기여자: Kakaru Hayate
|
||||
- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7)
|
||||
- 내용: 출력을 위한 선택적 분할 모드 추가.
|
||||
- 유형: 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180)
|
||||
- 내용: 여러 줄바꿈 문제로 인한 추론 오류 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b)
|
||||
- 내용: 반 정밀도를 지원하지 않는 GPU의 경우 자동으로 단 정밀도 강제; CPU 추론 시 단 정밀도 강제.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238)
|
||||
- 내용: Dockerfile에서 모델 다운로드 프로세스 완료.
|
||||
- 유형: 수정
|
||||
- 기여자: breakstring
|
||||
- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257)
|
||||
- 내용: 숫자의 발음이 한자로 변환되는 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: duliangang
|
||||
- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683)
|
||||
- 내용: GPT 학습 시 체크포인트가 저장되지 않는 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8)
|
||||
- 내용: 제한을 설정하여 불합리한 참조 오디오 길이 제외.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3)
|
||||
- 내용: 문장 시작 부분에서 몇 글자를 누락시키는 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0)
|
||||
- 내용: 16 시리즈와 같은 반 정밀도 학습에 문제가 있는 GPU를 위해 학습 구성을 단 정밀도로 변경.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec)
|
||||
- 내용: 사용 가능한 Colab 버전 테스트 및 업데이트.
|
||||
- 유형: 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135)
|
||||
- 내용: FunASR을 버전 1.0으로 업데이트 및 인터페이스 불일치로 인한 오류 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: LauraGPT
|
||||
- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4)
|
||||
- 내용: 중국어 및 영어 구두점 분할 문제 수정 및 문장 시작과 끝에 구두점 추가.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2)
|
||||
- 내용: 구두점으로 분할 지원 추가.
|
||||
- 유형: 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7)
|
||||
- 내용: 초보 사용자가 경로를 복사할 때 큰따옴표를 포함하여 오류가 발생하는 것을 방지하기 위해 모든 경로 관련 항목에서 큰따옴표 자동 제거.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
|
||||
## 20240122
|
||||
## 202402
|
||||
|
||||
1. 지나치게 짧은 출력 파일로 인해 참조 오디오가 반복되는 문제를 수정했습니다.
|
||||
2. 영어 및 일본어 훈련의 네이티브 지원을 테스트했습니다 (일본어 훈련 시 루트 디렉토리에 비영어 특수 문자가 없어야 합니다).
|
||||
3. 오디오 경로 확인을 개선했습니다. 잘못된 입력 경로에서 읽으려는 시도가 있을 경우, ffmpeg 오류 대신 경로가 존재하지 않는다고 보고합니다.
|
||||
|
||||
## 20240123
|
||||
|
||||
1. Hubert 추출로 인해 NaN 오류가 발생하여 SoVITS/GPT 훈련에서 ZeroDivisionError가 발생하는 문제를 해결했습니다.
|
||||
2. 추론 WebUI에서 빠른 모델 전환 지원을 추가했습니다.
|
||||
3. 모델 파일 정렬 로직을 최적화했습니다.
|
||||
4. 중국어 단어 분할을 위해 `jieba`를 `jieba_fast`로 교체했습니다.
|
||||
|
||||
## 20240126
|
||||
|
||||
1. 중국어-영어 혼합 및 일본어-영어 혼합 출력 텍스트를 지원합니다.
|
||||
2. 출력에 대한 선택적 분할 모드를 추가했습니다.
|
||||
3. UVR5 읽기 문제 및 디렉토리 자동 탈출 문제를 수정했습니다.
|
||||
4. 추론 오류를 일으키는 여러 줄 바꿈 문제를 수정했습니다.
|
||||
5. 추론 WebUI 에서 중복 로그를 제거했습니다.
|
||||
6. Mac에서 훈련 및 추론을 지원합니다.
|
||||
7. 절반 정밀도를 지원하지 않는 GPU에 대해 자동으로 단정밀도를 강제하며, CPU 추론 시 단정밀도를 적용합니다.
|
||||
|
||||
## 20240128
|
||||
|
||||
1. 숫자의 발음이 중국어 문자로 변환되는 문제를 수정했습니다.
|
||||
2. 문장 시작 부분에서 몇 개의 문자가 누락되는 문제를 수정했습니다.
|
||||
3. 비합리적인 참조 오디오 길이를 설정하여 제외했습니다.
|
||||
4. GPT 훈련 시 체크포인트가 저장되지 않는 문제를 수정했습니다.
|
||||
5. Dockerfile 에서 모델 다운로드 프로세스를 완료했습니다.
|
||||
|
||||
## 20240129
|
||||
|
||||
1. 절반 정밀도 훈련에 문제가 있는 16 시리즈와 같은 GPU의 훈련 구성을 단정밀도로 변경했습니다.
|
||||
2. 사용 가능한 Colab 버전을 테스트하고 업데이트했습니다.
|
||||
3. 이전 버전의 FunASR 로 인해 인터페이스 정렬 오류가 발생하는 ModelScope FunASR 저장소의 git 클로닝 문제를 수정했습니다.
|
||||
|
||||
## 20240130
|
||||
|
||||
1. 모든 경로 관련 항목에서 이중 따옴표를 자동으로 제거하여 초보자가 이중 따옴표가 포함된 경로를 복사하는 오류를 방지했습니다.
|
||||
2. 중국어 및 영어 문장 부호 분할 문제를 수정하고 문장 시작과 끝에 부호를 추가했습니다.
|
||||
3. 부호에 의한 분할을 추가했습니다.
|
||||
|
||||
## 20240201
|
||||
|
||||
1. 분리 실패를 일으킨 UVR5 형식 읽기 오류를 수정했습니다.
|
||||
2. 혼합된 중국어-일본어-영어 텍스트에 대한 자동 분할 및 언어 인식을 지원합니다.
|
||||
|
||||
## 20240202
|
||||
|
||||
1. `/` 로 끝나는 ASR 경로가 파일 이름 저장 시 오류를 발생시키는 문제를 수정했습니다.
|
||||
2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) 에서는 PaddleSpeech 의 Normalizer 를 도입하여 "xx.xx%" (백분율 기호)와 "元/吨"이 "元吨"으로 읽히는 문제를 "元每吨"으로 수정하고, 밑줄 오류를 수정했습니다.
|
||||
|
||||
## 20240207
|
||||
|
||||
1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) 에서 보고된 중국어 추론 품질 저하를 일으킨 언어 매개변수 혼동을 수정했습니다.
|
||||
2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) 에서는 UVR5 를 높은 버전의 librosa에 맞게 조정했습니다.
|
||||
3. [Commit 14a2851](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)에서는 `is_half` 매개변수가 불리언으로 변환되지 않아 발생한 UVR5 `inf` 오류를 수정했습니다. 이로 인해 16 시리즈 GPU에서 `inf` 가 발생했습니다.
|
||||
4. 영어 텍스트 프론트엔드를 최적화했습니다.
|
||||
5. Gradio 종속성 문제를 수정했습니다.
|
||||
6. 데이터셋 준비 시 루트 디렉토리를 비워두면 `.list` 전체 경로를 자동으로 읽도록 지원합니다.
|
||||
7. 일본어와 영어에 대한 Faster Whisper ASR을 통합했습니다.
|
||||
|
||||
## 20240208
|
||||
|
||||
1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)에서는 Windows 10 1909와 [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) (전통 중국어 시스템 언어)에서 GPT 훈련 멈춤 문제를 수정하려고 했습니다.
|
||||
|
||||
## 20240212
|
||||
|
||||
1. Faster Whisper와 FunASR의 로직을 최적화하고, Faster Whisper를 미러 다운로드로 전환하여 Hugging Face 연결 문제를 피했습니다.
|
||||
2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)은 DPO Loss 실험적 훈련 옵션을 활성화하여 GPT의 반복 및 문자 누락 문제를 완화하고, 훈련 중 부정 샘플을 구성하며 여러 추론 매개변수를 추론 WebUI에서 사용할 수 있게 했습니다.
|
||||
|
||||
## 20240214
|
||||
|
||||
1. 훈련 시 중국어 실험 이름을 지원합니다 (이전에는 오류가 발생했습니다).
|
||||
2. DPO 훈련을 필수 기능 대신 선택적 기능으로 변경했습니다. 선택 시, 배치 크기가 자동으로 절반으로 줄어듭니다. 추론 WebUI에서 새로운 매개변수가 전달되지 않는 문제를 수정했습니다.
|
||||
|
||||
## 20240216
|
||||
|
||||
1. 참조 텍스트 없이 입력을 지원합니다.
|
||||
2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475)에서 보고된 중국어 프론트엔드의 버그를 수정했습니다.
|
||||
|
||||
## 20240221
|
||||
|
||||
1. 데이터 처리 중 노이즈 감소 옵션을 추가했습니다 (노이즈 감소는 16kHz 샘플링 비율만 남깁니다; 배경 노이즈가 심한 경우에만 사용하십시오).
|
||||
2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) 중국어 및 일본어 프론트엔드 처리를 최적화했습니다.
|
||||
3. Mac CPU 추론을 MPS 대신 CPU를 사용하도록 전환하여 성능을 향상시켰습니다.
|
||||
4. Colab 공개 URL 문제를 수정했습니다.
|
||||
|
||||
## 20240306
|
||||
|
||||
1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)는 추론 속도를 50% 가속화했습니다 (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39에서 테스트됨).
|
||||
2. Faster Whisper의 비중국어 ASR을 사용할 때 중국어 FunASR 모델을 먼저 다운로드할 필요가 없습니다.
|
||||
3. [PR 610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610)은 UVR5 리버브 제거 모델에서 설정이 반대로 되어 있는 문제를 수정했습니다.
|
||||
4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675)는 CUDA가 없는 경우 Faster Whisper의 자동 CPU 추론을 가능하게 했습니다.
|
||||
5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573)은 Mac에서 올바른 CPU 추론을 보장하기 위해 `is_half` 체크를 수정했습니다.
|
||||
|
||||
## 202403/202404/202405
|
||||
|
||||
### 사소한 수정:
|
||||
|
||||
1. 참조 텍스트 없는 모드의 문제를 수정했습니다.
|
||||
2. 중국어 및 영어 텍스트 프론트엔드를 최적화했습니다.
|
||||
3. API 형식을 개선했습니다.
|
||||
4. CMD 형식 문제를 수정했습니다.
|
||||
5. 훈련 데이터 처리 중 지원되지 않는 언어에 대한 오류 프롬프트를 추가했습니다.
|
||||
6. Hubert 추출의 버그를 수정했습니다.
|
||||
|
||||
### 주요 수정:
|
||||
|
||||
1. VQ를 고정하지 않고 SoVITS 훈련의 문제를 수정했습니다(품질 저하를 일으킬 수 있음).
|
||||
2. 빠른 추론 분기를 추가했습니다.
|
||||
|
||||
## 20240610
|
||||
|
||||
### 사소한 수정:
|
||||
|
||||
1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) 순수 구두점 및 다중 구두점 텍스트 입력 로직을 개선했습니다.
|
||||
2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) UVR5에서 MDXNet 디러버브를 위한 CMD 형식을 수정하고 공백이 있는 경로를 지원했습니다.
|
||||
3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) `s2_train.py`에서 SoVITS 훈련을 위한 진행률 표시줄 로직을 수정했습니다.
|
||||
|
||||
### 주요 수정:
|
||||
|
||||
4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) WebUI의 GPT 미세 조정이 중국어 입력 텍스트의 BERT 기능을 읽지 않아 추론과 불일치 및 잠재적 품질 저하를 일으키는 문제를 수정했습니다.
|
||||
**주의: 이전에 많은 양의 데이터로 미세 조정한 경우 품질을 향상시키기 위해 모델을 다시 조정하는 것이 좋습니다.**
|
||||
|
||||
## 20240706
|
||||
|
||||
### 사소한 수정:
|
||||
|
||||
1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) CPU 추론에서 기본 배치 크기 소수점 문제를 수정했습니다.
|
||||
2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) 노이즈 제거 또는 ASR이 예외를 만나면 모든 보류 중인 오디오 파일이 종료되는 문제를 수정했습니다.
|
||||
3. [PR 1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) 구두점으로 분할할 때 소수점 분할 문제를 수정했습니다.
|
||||
4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) 다중 GPU 훈련을 위한 다중 프로세스 저장 로직을 수정했습니다.
|
||||
5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) 불필요한 `my_utils`를 제거했습니다.
|
||||
|
||||
### 주요 수정:
|
||||
|
||||
6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)의 가속 추론 코드가 검증되어 메인 브랜치에 병합되었으며, 기본과 일관된 추론 효과를 보장합니다.
|
||||
또한 참조 텍스트 없는 모드에서 가속 추론을 지원합니다.
|
||||
|
||||
**향후 업데이트에서는 `fast_inference` 브랜치의 변경 사항의 일관성을 계속 검증할 것입니다**.
|
||||
|
||||
## 20240727
|
||||
|
||||
### 사소한 수정:
|
||||
|
||||
1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) 불필요한 i18n 코드를 정리했습니다.
|
||||
2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) 사용자 파일 경로의 후행 슬래시가 명령줄 오류를 일으키는 문제를 수정했습니다.
|
||||
3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) GPT 훈련의 단계 계산 로직을 수정했습니다.
|
||||
|
||||
### 주요 수정:
|
||||
|
||||
4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) 합성을 위한 음성 속도 조절을 지원했습니다.
|
||||
음성 속도만 조절하면서 무작위성을 고정할 수 있습니다.
|
||||
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): BS-RoFormer 보컬 분리 모델 지원 추가.
|
||||
- 유형: 신규 기능
|
||||
- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6)
|
||||
- 내용: ASR 경로가 `/`로 끝날 때 파일명 저장 오류 발생 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7)
|
||||
- 내용: UVR5 형식 읽기 오류로 인한 분리 실패 문제 해결.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7)
|
||||
- 내용: 중국어-일본어-영어 혼합 텍스트 자동 분할 및 언어 인식 지원.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377)
|
||||
- 내용: PaddleSpeech Normalizer 도입으로 "xx.xx%"(퍼센트 기호) 및 "元/吨"이 "元吨" 대신 "元每吨"으로 읽히는 문제, 언더스코어 오류 수정.
|
||||
- 유형: 최적화
|
||||
- 기여자: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): 중국어 텍스트 프론트엔드 개선.
|
||||
- 유형: 신규 기능
|
||||
- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395)
|
||||
- 내용: 영어 텍스트 프론트엔드 최적화.
|
||||
- 유형: 최적화
|
||||
- 기여자: KamioRinn
|
||||
- 2024.02.06 [Commit#65b463a7](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927)
|
||||
- 내용: 언어 매개변수 혼동으로 인한 중국어 추론 품질 저하 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 관련: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)
|
||||
- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403)
|
||||
- 내용: UVR5을 librosa 상위 버전에 적응시킴.
|
||||
- 유형: 수정
|
||||
- 기여자: StaryLan
|
||||
- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)
|
||||
- 내용: `is_half` 매개변수가 불리언으로 변환되지 않아 발생한 UVR5 inf 오류 수정 (16 시리즈 GPU에서 `inf` 문제 발생).
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2)
|
||||
- 내용: Gradio 의존성 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400)
|
||||
- 내용: 일본어 및 영어용 Faster Whisper ASR 통합.
|
||||
- 유형: 기능
|
||||
- 기여자: Shadow
|
||||
- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10)
|
||||
- 내용: 데이터셋 준비 시 루트 디렉토리를 비워둘 경우 `.list` 전체 경로 자동 읽기 지원.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)
|
||||
- 내용: Windows 10 1909 및 번체 중국어 시스템 언어에서 GPT 훈련 중단 문제 해결 시도.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 관련: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232)
|
||||
- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)
|
||||
- 내용: DPO Loss 훈련 옵션 추가 (GPT 반복 및 문자 누락 완화), 추론 WebUI에 여러 매개변수 노출.
|
||||
- 유형: 기능
|
||||
- 기여자: liufenghua
|
||||
- 2024.02.12 [Commit#2fa74ecb](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#d82f6bbb](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28)
|
||||
- 내용: Faster Whisper 및 FunASR 로직 최적화, Hugging Face 연결 문제 회피를 위해 미러 다운로드로 전환.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.15 [Commit#dd2c4d6d](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8)
|
||||
- 내용: 훈련 시 중국어 실험 이름 지원 (이전 버전에서는 오류 발생).
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b)
|
||||
- 내용: DPO 훈련을 필수에서 선택 사항으로 변경. 선택 시 배치 크기 자동 절반 감소. 추론 WebUI에서 새 매개변수 전달 문제 수정.
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5)
|
||||
- 내용: 중국어 프론트엔드 버그 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499)
|
||||
- 내용: 참조 텍스트 없이 입력 지원.
|
||||
- 유형: 기능
|
||||
- 기여자: Watchtower-Liu
|
||||
- 관련: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475)
|
||||
- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559)
|
||||
- 내용: 중국어 및 일본어 프론트엔드 처리 최적화.
|
||||
- 유형: 최적화
|
||||
- 기여자: KamioRinn, v3cun
|
||||
- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511)
|
||||
- 내용: Colab 공개 URL 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: ChanningWang2018, RVC-Boss
|
||||
- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557)
|
||||
- 내용: Mac CPU 추론 시 MPS 대신 CPU 사용으로 성능 향상.
|
||||
- 유형: 최적화
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#5a171773](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35)
|
||||
- 내용: 데이터 처리 시 노이즈 감소 옵션 추가 (16kHz 샘플링 레이트만 유지, 배경 노이즈가 심한 경우에만 사용 권장).
|
||||
- 유형: 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573)
|
||||
- 내용: Mac에서 CPU 추론이 정상적으로 작동하도록 `is_half` 확인 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610)
|
||||
- 내용: UVR5 리버브 제거 모델 설정이 반대로 되어 있던 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: Yuze Wang
|
||||
|
||||
## 202403
|
||||
|
||||
- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675)
|
||||
- 내용: CUDA가 없는 경우 Faster Whisper의 자동 CPU 추론 기능 활성화
|
||||
- 유형: 최적화
|
||||
- 기여자: ShiroDoMain
|
||||
- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193)
|
||||
- 내용: Faster Whisper 비중국어 ASR 사용 시 중국어 FunASR 모델을 먼저 다운로드할 필요 없음
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- 내용: 추론 속도 50% 향상 (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 환경 테스트)
|
||||
- 유형: 최적화
|
||||
- 기여자: GoHomeToMacDonal
|
||||
- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721)
|
||||
- 내용: 빠른 추론 브랜치 'fast_inference_' 추가
|
||||
- 유형: 기능
|
||||
- 기여자: ChasonJiang
|
||||
- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761)
|
||||
- 내용: CPU 훈련 지원 추가, macOS에서 CPU를 사용한 훈련 가능
|
||||
- 유형: 기능
|
||||
- 기여자: Lion-Wu
|
||||
- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821)
|
||||
- 내용: 영어 텍스트 프론트엔드 최적화
|
||||
- 유형: 최적화
|
||||
- 기여자: KamioRinn
|
||||
- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894)
|
||||
- 내용: API 형식 개선
|
||||
- 유형: 최적화
|
||||
- 기여자: KamioRinn
|
||||
|
||||
## 202404
|
||||
|
||||
- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917)
|
||||
- 내용: UVR5 WebUI에서 FFmpeg 명령어 문자열 형식 수정
|
||||
- 유형: 수정
|
||||
- 기여자: StaryLan
|
||||
|
||||
## 202405
|
||||
|
||||
- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953)
|
||||
- 내용: SoVITS 훈련 시 VQ를 고정하지 않아 발생하는 품질 저하 문제 해결
|
||||
- 유형: 수정
|
||||
- 기여자: hcwu1993
|
||||
- 관련: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747)
|
||||
- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102)
|
||||
- 내용: 훈련 데이터 처리 시 지원되지 않는 언어에 대한 오류 메시지 추가
|
||||
- 유형: 최적화
|
||||
- 기여자: StaryLan
|
||||
- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132)
|
||||
- 내용: Hubert 추출 버그 수정
|
||||
- 유형: 수정
|
||||
- 기여자: XXXXRT666
|
||||
|
||||
## 202406
|
||||
|
||||
- 2024.06.06 [Commit#99f09c8b](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a)
|
||||
- 내용: WebUI의 GPT 미세조정 시 중국어 입력 텍스트의 BERT 특징을 읽지 않아 추론과 불일치 및 품질 저하가 발생하는 문제 수정
|
||||
**주의: 이전에 대량의 데이터로 미세조정을 한 경우 품질 향상을 위해 모델 재조정 권장**
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159)
|
||||
- 내용: `s2_train.py`에서 SoVITS 훈련 진행률 표시 로직 수정
|
||||
- 유형: 수정
|
||||
- 기여자: pengzhendong
|
||||
- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232)
|
||||
- 내용: UVR5 MDXNet이 FFmpeg 호출 시 공백 포함 경로와의 호환성을 보장하도록 문자열 형식 수정
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169)
|
||||
- 내용: 순수 구두점 및 다중 구두점 텍스트 입력 처리 로직 개선
|
||||
- 유형: 수정
|
||||
- 기여자: XXXXRT666
|
||||
- 관련: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165)
|
||||
- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041)
|
||||
- 내용: CPU 추론 시 기본 배치 크기 소수점 문제 수정
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267)
|
||||
- 내용: 잡음 제거 또는 ASR 처리 중 예외 발생 시 대기 중인 모든 오디오 파일이 종료되는 문제 수정
|
||||
- 유형: 수정
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca)
|
||||
- 내용: 다중 GPU 훈련 시 다중 프로세스 저장 로직 수정
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251)
|
||||
- 내용: 중복된 `my_utils.py` 제거
|
||||
- 유형: 최적화
|
||||
- 기여자: aoguai
|
||||
- 관련: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189)
|
||||
|
||||
## 202407
|
||||
|
||||
- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253)
|
||||
- 내용: 구두점 분할 시 소수점이 분할되는 문제 수정
|
||||
- 유형: 수정
|
||||
- 기여자: aoguai
|
||||
- 2024.07.06 [Commit#b0786f29](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5)
|
||||
- 내용: 가속 추론 코드 검증 완료 및 메인 브랜치 병합. 기본 버전과 동일한 추론 효과 보장하며 참조 텍스트 없음 모드에서도 가속 추론 지원
|
||||
- 유형: 최적화
|
||||
- 기여자: RVC-Boss, GoHomeToMacDonal
|
||||
- 관련: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- 향후 업데이트에서는 `fast_inference` 브랜치의 변경 사항 일관성 검증을 지속할 예정입니다.
|
||||
|
||||
- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298)
|
||||
- 내용: i18n 스캐닝 리팩토링 및 다국어 구성 파일 업데이트
|
||||
- 유형: 문서화
|
||||
- 기여자: StaryLan
|
||||
- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299)
|
||||
- 내용: 사용자 파일 경로의 끝 슬래시로 인한 명령줄 오류 문제 수정
|
||||
- 유형: 수정
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756)
|
||||
- 내용: GPT 훈련 시 사용자 정의 `bucket_sampler` 사용 시 훈련 단계 불일치 문제 수정
|
||||
- 유형: 수정
|
||||
- 기여자: huangxu1991
|
||||
- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340)
|
||||
- 내용: 합성 중 음성 속도 조절 기능 추가(무작위성 고정 및 속도만 제어 옵션 포함). 이 기능은 `api.py`에 업데이트됨
|
||||
- 유형: 기능
|
||||
- 기여자: RVC-Boss, 红血球AE3803
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356)
|
||||
- 내용: BS-RoFormer 보컬 분리 모델 지원 추가
|
||||
- 유형: 기능
|
||||
- 기여자: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351)
|
||||
- 내용: 중국어 텍스트 프론트엔드 개선
|
||||
- 유형: 기능
|
||||
- 기여자: KamioRinn
|
||||
|
||||
## 202408 (V2 버전)
|
||||
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): WebUI에서 파일 처리 시 경로 자동 입력 기능 추가.
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355)
|
||||
- 내용: WebUI에서 파일 처리 시 경로 자동 입력 기능 추가.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): BS-Roformer FP16 추론 지원 활성화.
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c)
|
||||
- 내용: BS-Roformer FP16 추론 지원 활성화.
|
||||
- 유형: 성능 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): GPU 인식 로직 최적화, 사용자 입력 GPU 인덱스 처리 로직 추가.
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78)
|
||||
- 내용: GPU 인식 로직 최적화, 사용자 입력 GPU 인덱스 처리 로직 추가.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **GPT-SoVITS V2 모델 추가.**
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758)
|
||||
- 내용: **GPT-SoVITS V2 모델 추가.**
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): FunASR을 이용한 광둥어 ASR 지원 추가.
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3)
|
||||
- 내용: FunASR을 이용한 광둥어 ASR 지원 추가.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): UI 및 타이밍 로직 최적화.
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388)
|
||||
- 내용: UI 및 타이밍 로직 최적화.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): 다중 발음 문자 처리 로직 최적화 (V2 전용).
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488)
|
||||
- 내용: 다중 발음 문자 처리 로직 최적화 (V2 전용).
|
||||
- 유형: 수정, 신규 기능
|
||||
- 기여자: KamioRinn, RVC-Boss
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): 참조 오디오 1개만 업로드 가능한 버그 수정; 누락 파일 경고 팝업 추가.
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422)
|
||||
- 내용: 참조 오디오 1개만 업로드 가능한 버그 수정; 누락 파일 경고 팝업 추가.
|
||||
- 유형: 수정, 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): 상위 LangSegment 라이브러리에서 SSML 태그로 숫자, 전화번호, 날짜, 시간 최적화 지원.
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508)
|
||||
- 내용: 상위 LangSegment 라이브러리에서 SSML 태그로 숫자, 전화번호, 날짜, 시간 최적화 지원.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: juntaosun
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): API 수정 및 최적화.
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503)
|
||||
- 내용: API 수정 및 최적화.
|
||||
- 유형: 수정
|
||||
- 기여자: KamioRinn
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): `fast_inference` 브랜치를 메인 브랜치로 병합.
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490)
|
||||
- 내용: `fast_inference` 브랜치를 메인 브랜치로 병합.
|
||||
- 유형: 리팩토링
|
||||
- 기여자: ChasonJiang
|
||||
- 2024.08.21 **GPT-SoVITS V2 버전 정식 출시.**
|
||||
|
||||
## 202502 (V3 버전)
|
||||
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **GPT-SoVITS V3 모델 추가, 파인튜닝 시 14GB VRAM 필요.**
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4)
|
||||
- 내용: **GPT-SoVITS V3 모델 추가, 파인튜닝 시 14GB VRAM 필요.**
|
||||
- 유형: 신규 기능 ([위키 참조](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)))
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): 다국어 프로젝트 문서 업데이트.
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032)
|
||||
- 내용: 다국어 프로젝트 문서 업데이트.
|
||||
- 유형: 문서화
|
||||
- 기여자: StaryLan
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): 일본어 문서 업데이트.
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033)
|
||||
- 내용: 일본어 문서 업데이트.
|
||||
- 유형: 문서화
|
||||
- 기여자: Fyphen
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): 어텐션 계산 로직 최적화.
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010)
|
||||
- 내용: 어텐션 계산 로직 최적화.
|
||||
- 유형: 성능 최적화
|
||||
- 기여자: wzy3650
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): 파인튜닝 시 그래디언트 체크포인팅 지원 추가, 12GB VRAM 필요.
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040)
|
||||
- 내용: 파인튜닝 시 그래디언트 체크포인팅 지원 추가, 12GB VRAM 필요.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: Kakaru Hayate
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): 새로운 언어 분할 도구 전환, 다국어 혼합 텍스트 분할 전략 개선, 숫자 및 영어 처리 로직 최적화.
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073)
|
||||
- 내용: 새로운 언어 분할 도구 전환, 다국어 혼합 텍스트 분할 전략 개선, 숫자 및 영어 처리 로직 최적화.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: KamioRinn
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 모델 LoRA 학습 지원 추가, 파인튜닝 시 8GB GPU 메모리 필요.**
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e)
|
||||
- 내용: **GPT-SoVITS V3 모델 LoRA 학습 지원 추가, 파인튜닝 시 8GB GPU 메모리 필요.**
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): 보컬 및 악기 분리를 위한 Mel Band Roformer 모델 지원 추가.
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078)
|
||||
- 내용: 보컬 및 악기 분리를 위한 Mel Band Roformer 모델 지원 추가.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: Sucial
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): 중국어 경로에서 MeCab 오류 수정 (일본어/한국어 또는 다국어 텍스트 분할 전용).
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114)
|
||||
- 내용: 중국어 경로에서 MeCab 오류 수정 (일본어/한국어 또는 다국어 텍스트 분할 전용).
|
||||
- 유형: 수정
|
||||
- 기여자: KamioRinn
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **24kHz에서 48kHz 오디오 초해상도 모델 추가** (V3 모델로 24K 오디오 생성 시 "뭉개지는" 현상 완화).
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc)
|
||||
- 내용: **24kHz에서 48kHz 오디오 초해상도 모델 추가** (V3 모델로 24K 오디오 생성 시 "뭉개지는" 현상 완화).
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 관련: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): 다국어 프로젝트 문서 업데이트.
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123)
|
||||
- 내용: 다국어 프로젝트 문서 업데이트.
|
||||
- 유형: 문서화
|
||||
- 기여자: StaryLan
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): 모델이 인식하지 못하는 짧은 CJK 문자에 대해 규칙 기반 검출 적용.
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122)
|
||||
- 내용: 모델이 인식하지 못하는 짧은 CJK 문자에 대해 규칙 기반 검출 적용.
|
||||
- 유형: 수정
|
||||
- 기여자: KamioRinn
|
||||
- 관련: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116)
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): 음성 속도 제어 매개변수 추가.
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5)
|
||||
- 내용: 음성 속도 제어 매개변수 추가.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.02.28 **GPT-SoVITS V3 정식 출시**.
|
||||
|
||||
## 202503
|
||||
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): 의존성 버전 오류로 인한 문제 수정.
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236)
|
||||
- 내용: 의존성 버전 오류로 인한 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: XXXXRT666
|
||||
- 관련:
|
||||
@@ -264,7 +474,8 @@
|
||||
- ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841).
|
||||
- Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239).
|
||||
- PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174).
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **SoVITS v3 병렬 추론 지원 활성화.**
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241)
|
||||
- 내용: **SoVITS v3 병렬 추론 지원 활성화.**
|
||||
- 유형: 신규 기능
|
||||
- 기여자: ChasonJiang
|
||||
|
||||
@@ -278,56 +489,92 @@
|
||||
|
||||
## 202504 (V4 버전)
|
||||
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): SoVITS v3 병렬 추론 잠금 해제; 비동기 모델 로딩 로직 수정.
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f)
|
||||
- 내용: SoVITS v3 병렬 추론 잠금 해제; 비동기 모델 로딩 로직 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruff를 이용한 코드 포맷팅; G2PW 링크 업데이트.
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255)
|
||||
- 내용: Ruff를 이용한 코드 포맷팅; G2PW 링크 업데이트.
|
||||
- 유형: 스타일
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): 문서 정리; Python 3.11 지원 추가; 설치 프로그램 업데이트.
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290)
|
||||
- 내용: 문서 정리; Python 3.11 지원 추가; 설치 프로그램 업데이트.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Colab, 설치 파일 및 모델 다운로드 업데이트.
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300)
|
||||
- 내용: Colab, 설치 파일 및 모델 다운로드 업데이트.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **GPT-SoVITS V4 모델 추가.**
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf)
|
||||
- 내용: **GPT-SoVITS V4 모델 추가.**
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): V4 병렬 추론 지원 활성화.
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307)
|
||||
- 내용: V4 병렬 추론 지원 활성화.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): 모델 버전 매개변수 전달 오류 수정.
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309)
|
||||
- 내용: 모델 버전 매개변수 전달 오류 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): Numpy와 Numba 버전 불일치 문제 수정; librosa 버전 업데이트.
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310)
|
||||
- 내용: Numpy와 Numba 버전 불일치 문제 수정; librosa 버전 업데이트.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss, XXXXRT666
|
||||
- 관련: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308)
|
||||
- **2024.04.22 GPT-SoVITS V4 정식 출시**.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Gradio 매개변수 업데이트.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311)
|
||||
- 내용: Gradio 매개변수 업데이트.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Colab/Kaggle 노트북 스크립트 개선.
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322)
|
||||
- 내용: Colab/Kaggle 노트북 스크립트 개선.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
|
||||
## 202505
|
||||
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): Docker 및 Windows 자동 빌드 스크립트 개선; pre-commit 포맷팅 추가.
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351)
|
||||
- 내용: Docker 및 Windows 자동 빌드 스크립트 개선; pre-commit 포맷팅 추가.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): 다국어 텍스트 분할 및 인식 로직 최적화.
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408)
|
||||
- 내용: 다국어 텍스트 분할 및 인식 로직 최적화.
|
||||
- 유형: 수정
|
||||
- 기여자: KamioRinn
|
||||
- 관련: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404)
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): 캐싱 전략 구현으로 SoVITS V3/V4 추론 속도 10% 향상.
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377)
|
||||
- 내용: 캐싱 전략 구현으로 SoVITS V3/V4 추론 속도 10% 향상.
|
||||
- 유형: 성능 최적화
|
||||
- 기여자: Kakaru Hayate
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): 어노테이션 인터페이스를 업데이트하여 안내 문구를 추가했습니다: 각 페이지 편집 후 반드시 'Submit Text'를 클릭해 주세요. 그렇지 않으면 변경 사항이 저장되지 않습니다.
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba)
|
||||
- 내용: 어노테이션 인터페이스를 업데이트하여 안내 문구를 추가했습니다: 각 페이지 편집 후 반드시 'Submit Text'를 클릭해 주세요. 그렇지 않으면 변경 사항이 저장되지 않습니다.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): UVR5 및 ONNX dereverberation 모델에서 FFmpeg이 공백 포함 원본 경로로 MP3/M4A 파일 인코딩 시 오류 수정.
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc)
|
||||
- 내용: UVR5 및 ONNX dereverberation 모델에서 FFmpeg이 공백 포함 원본 경로로 MP3/M4A 파일 인코딩 시 오류 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
|
||||
**미리보기: 단오절 이후 V2 버전 기반 대규모 최적화 업데이트 예정!**
|
||||
## 202406 (V2Pro 시리즈)
|
||||
|
||||
- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420)
|
||||
- 내용: 다국어 프로젝트 문서 업데이트
|
||||
- 유형: 문서화
|
||||
- 기여자: StaryLan
|
||||
- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417)
|
||||
- 내용: TorchScript를 이용한 V4 내보내기 기능 지원 추가
|
||||
- 유형: 기능 추가
|
||||
- 기여자: L-jasmine
|
||||
- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70)
|
||||
- 내용: **GPT-SoVITS V2Pro 시리즈 모델 추가 (V2Pro, V2ProPlus)**
|
||||
- 유형: 기능 추가
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426)
|
||||
- 내용: `config/inference_webui` 초기화 오류 수정
|
||||
- 유형: 버그 수정
|
||||
- 기여자: StaryLan
|
||||
- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434)
|
||||
- 내용: 자동 정밀도 감지 로직 최적화; WebUI 프론트엔드 모듈에 접기 기능 추가
|
||||
- 유형: 신규 기능
|
||||
- 기여자: XXXXRT666, RVC-Boss
|
||||
|
||||
@@ -299,6 +299,38 @@ v2 환경에서 v3 사용하기:
|
||||
|
||||
추가: 오디오 슈퍼 해상도 모델에 대해서는 [다운로드 방법](../../tools/AP_BWE_main/24kto48k/readme.txt)을 참고하세요.
|
||||
|
||||
## V4 릴리스 노트
|
||||
|
||||
신규 기능:
|
||||
|
||||
1. **V4는 V3에서 발생하는 비정수 배율 업샘플링으로 인한 금속성 잡음 문제를 수정했으며, 소리가 먹먹해지는 것을 방지하기 위해 기본적으로 48kHz 오디오를 출력합니다 (V3는 기본적으로 24kHz만 지원)**. 개발자는 V4를 V3의 직접적인 대체 버전으로 보고 있지만 추가 테스트가 필요합니다.
|
||||
[자세히 보기](<https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3v4%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)>)
|
||||
|
||||
V1/V2/V3 환경에서 V4로 전환 방법:
|
||||
|
||||
1. 일부 의존 패키지를 업데이트하기 위해 `pip install -r requirements.txt` 명령어를 실행하세요.
|
||||
|
||||
2. GitHub에서 최신 코드를 클론하세요.
|
||||
|
||||
3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main)에서 V4 사전 학습 모델(`gsv-v4-pretrained/s2v4.ckpt` 및 `gsv-v4-pretrained/vocoder.pth`)을 다운로드하고 `GPT_SoVITS/pretrained_models` 디렉토리에 넣으세요.
|
||||
|
||||
## V2Pro 릴리스 노트
|
||||
|
||||
신규 기능:
|
||||
|
||||
1. **V2보다 약간 높은 VRAM 사용량이지만 성능은 V4보다 우수하며, V2 수준의 하드웨어 비용과 속도를 유지합니다**.
|
||||
[자세히 보기](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90features-(%E5%90%84%E7%89%88%E6%9C%AC%E7%89%B9%E6%80%A7))
|
||||
|
||||
2. V1/V2와 V2Pro 시리즈는 유사한 특징을 가지며, V3/V4도 비슷한 기능을 가지고 있습니다. 평균 음질이 낮은 학습 데이터셋에서는 V1/V2/V2Pro가 좋은 결과를 내지만 V3/V4는 그렇지 못합니다. 또한 V3/V4의 합성 음색은 전체 학습 데이터셋보다는 참고 음성에 더 가깝습니다.
|
||||
|
||||
V1/V2/V3/V4 환경에서 V2Pro로 전환 방법:
|
||||
|
||||
1. 일부 의존 패키지를 업데이트하기 위해 `pip install -r requirements.txt` 명령어를 실행하세요.
|
||||
|
||||
2. GitHub에서 최신 코드를 클론하세요.
|
||||
|
||||
3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main)에서 V2Pro 사전 학습 모델(`v2Pro/s2Dv2Pro.pth`, `v2Pro/s2Gv2Pro.pth`, `v2Pro/s2Dv2ProPlus.pth`, `v2Pro/s2Gv2ProPlus.pth`, 및 `sv/pretrained_eres2netv2w24s4ep4.ckpt`)을 다운로드하고 `GPT_SoVITS/pretrained_models` 디렉토리에 넣으세요.
|
||||
|
||||
## 할 일 목록
|
||||
|
||||
- [x] **최우선순위:**
|
||||
@@ -382,6 +414,7 @@ python ./tools/asr/fasterwhisper_asr.py -i <input> -o <output> -l <language> -p
|
||||
- [Chinese Speech Pretrain](https://github.com/TencentGameMate/chinese_speech_pretrain)
|
||||
- [Chinese-Roberta-WWM-Ext-Large](https://huggingface.co/hfl/chinese-roberta-wwm-ext-large)
|
||||
- [BigVGAN](https://github.com/NVIDIA/BigVGAN)
|
||||
- [eresnetv2](https://modelscope.cn/models/iic/speech_eres2netv2w24s4ep4_sv_zh-cn_16k-common)
|
||||
|
||||
### 추론용 텍스트 프론트엔드
|
||||
|
||||
|
||||
@@ -1,262 +1,472 @@
|
||||
# Güncelleme Günlüğü
|
||||
|
||||
## 20240121
|
||||
## 202401
|
||||
|
||||
1. `config`e `is_share` eklendi. Colab gibi senaryolarda, WebUI'yi halka açık ağa yönlendirmek için bu değeri `True` olarak ayarlayabilirsiniz.
|
||||
2. WebUI'ye İngilizce sistem çeviri desteği eklendi.
|
||||
3. `cmd-asr`, FunASR modelinin dahil olup olmadığını otomatik olarak tespit eder; eğer varsayılan dizinde bulunamazsa, ModelScope'dan indirilecektir.
|
||||
4. [Issue 79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)de bildirilen SoVITS eğitimindeki ZeroDivisionError'u sıfır uzunlukta örnekleri filtreleyerek düzeltmeye çalıştık.
|
||||
5. `TEMP` klasöründeki önbelleğe alınmış ses dosyaları ve diğer dosyaları temizledik.
|
||||
6. Referans sesinin sonunu içeren sentezlenmiş ses sorununu önemli ölçüde azalttık.
|
||||
## 202401
|
||||
|
||||
## 20240122
|
||||
- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108)
|
||||
- İçerik: WebUI'ya İngilizce sistem çeviri desteği eklendi.
|
||||
- Tür: Dokümantasyon
|
||||
- Katkıda Bulunan: D3lik
|
||||
- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e)
|
||||
- İçerik: SoVITS eğitiminde ZeroDivisionError düzeltme girişimi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss, Tybost
|
||||
- İlgili: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)
|
||||
- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3)
|
||||
- İçerik: Sentezlenen sesin referans sesin sonunu içerme sorunu önemli ölçüde azaltıldı.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef)
|
||||
- İçerik: `cmd-asr.py` artık FunASR modelinin varsayılan dizinde olup olmadığını kontrol ediyor ve değilse ModelScope'tan indiriyor.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d)
|
||||
- İçerik: `Config.py`'a `is_share` parametresi eklendi, `True` olarak ayarlanırsa WebUI genel ağa eşlenir.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f)
|
||||
- İçerik: `TEMP` klasöründeki önbelleğe alınmış ses dosyaları ve diğer dosyalar temizlendi.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68)
|
||||
- İçerik: Aşırı kısa çıktı dosyalarının referans sesi tekrarlaması sorunu düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.22 İngilizce ve Japonca eğitim için yerel destek test edildi (Japonca eğitim için kök dizinde İngilizce olmayan özel karakterler olmamalı).
|
||||
- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124)
|
||||
- İçerik: Ses yolu kontrolü iyileştirildi. Yanlış giriş yolundan okuma girişiminde ffmpeg hatası yerine yolun mevcut olmadığı bildiriliyor.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: xmimu
|
||||
- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1)
|
||||
- İçerik: Hubert çıkarımının NaN hatalarına neden olarak SoVITS/GPT eğitiminde ZeroDivisionError'a yol açması sorunu çözüldü.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50)
|
||||
- İçerik: Çince kelime bölme için `jieba`, `jieba_fast` ile değiştirildi.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc)
|
||||
- İçerik: Model dosyası sıralama mantığı optimize edildi.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f)
|
||||
- İçerik: Çıkarım WebUI'ında hızlı model değiştirme desteği eklendi.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b)
|
||||
- İçerik: Çıkarım WebUI'ında gereksiz günlükler kaldırıldı.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200)
|
||||
- İçerik: Mac'te eğitim ve çıkarım desteği eklendi.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: Lion-Wu
|
||||
- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b)
|
||||
- İçerik: UVR5'in dizinleri okuyup otomatik olarak çıkması sorunu düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204)
|
||||
- İçerik: Çince-İngilizce ve Japonca-İngilizce karışık çıktı metinleri için destek eklendi.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: Kakaru Hayate
|
||||
- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7)
|
||||
- İçerik: Çıktı için isteğe bağlı bölümleme modu eklendi.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180)
|
||||
- İçerik: Birden fazla satır sonunun çıkarım hatasına neden olması sorunu düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b)
|
||||
- İçerik: Yarım hassasiyeti desteklemeyen GPU'lar için otomatik olarak tek hassasiyet zorlandı; CPU çıkarımında tek hassasiyet zorunlu kılındı.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238)
|
||||
- İçerik: Dockerfile'da model indirme süreci tamamlandı.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: breakstring
|
||||
- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257)
|
||||
- İçerik: Sayıların telaffuzunun Çince karakterlere dönüşmesi sorunu düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: duliangang
|
||||
- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683)
|
||||
- İçerik: GPT eğitiminde kontrol noktalarının kaydedilmemesi sorunu düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8)
|
||||
- İçerik: Kısıtlamalar ayarlanarak mantıksız referans ses uzunlukları hariç tutuldu.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3)
|
||||
- İçerik: Cümlelerin başında birkaç karakterin yutulması sorunu düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0)
|
||||
- İçerik: 16 serisi gibi yarım hassasiyet eğitiminde sorun yaşayan GPU'lar için eğitim yapılandırmaları tek hassasiyete değiştirildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec)
|
||||
- İçerik: Kullanılabilir Colab sürümü test edildi ve güncellendi.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135)
|
||||
- İçerik: FunASR Sürüm 1.0'a güncellendi ve arayüz uyumsuzluğundan kaynaklanan hatalar düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: LauraGPT
|
||||
- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4)
|
||||
- İçerik: Çince ve İngilizce noktalama işaretlerinin bölünmesi sorunları düzeltildi ve cümle başlarına ve sonlarına noktalama işaretleri eklendi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2)
|
||||
- İçerik: Noktalama işaretlerine göre bölme desteği eklendi.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7)
|
||||
- İçerik: Yeni kullanıcıların yolları çift tırnak içinde kopyalayarak hata yapmasını önlemek için tüm yol ile ilgili girdilerden çift tırnaklar otomatik olarak kaldırıldı.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
|
||||
1. Aşırı kısa çıktı dosyalarının referans sesini tekrarlamasına neden olan sorun giderildi.
|
||||
2. İngilizce ve Japonca eğitim için yerel destek test edildi (Japonca eğitim için kök dizinin İngilizce olmayan özel karakterlerden arındırılmış olması gerekir).
|
||||
3. Ses yolu denetimi iyileştirildi. Yanlış bir giriş yolundan okumaya çalışıldığında, ffmpeg hatası yerine yolun mevcut olmadığını bildirir.
|
||||
## 202402
|
||||
|
||||
## 20240123
|
||||
- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6)
|
||||
- İçerik: ASR yolunun `/` ile bitmesi durumunda dosya adı kaydetme hatası düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7)
|
||||
- İçerik: UVR5 format okuma hatası nedeniyle ayrıştırma başarısızlığı sorunu çözüldü.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7)
|
||||
- İçerik: Çince-Japonca-İngilizce karışık metinler için otomatik bölümleme ve dil tanıma desteği eklendi.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377)
|
||||
- İçerik: PaddleSpeech Normalizer entegre edildi - "xx.xx%" (yüzde sembolü) ve "元/吨" ifadelerinin "元吨" yerine "元每吨" olarak okunması sorunu ile alt çizgi hataları düzeltildi.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395)
|
||||
- İçerik: İngilizce metin ön uç işleme optimizasyonu yapıldı.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2024.02.06 [Commit#65b463a7](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927)
|
||||
- İçerik: Dil parametrelerinin karışması nedeniyle Çince çıkarım kalitesinin düşmesi sorunu giderildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- İlgili: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)
|
||||
- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403)
|
||||
- İçerik: UVR5, librosa'nın daha yeni sürümlerine uyumlu hale getirildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: StaryLan
|
||||
- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)
|
||||
- İçerik: `is_half` parametresinin boolean'a dönüştürülmemesi nedeniyle oluşan UVR5 inf hatası düzeltildi (16 serisi GPU'larda `inf` sorununa neden oluyordu).
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2)
|
||||
- İçerik: Gradio bağımlılık sorunları giderildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400)
|
||||
- İçerik: Japonca ve İngilizce için Faster Whisper ASR entegrasyonu yapıldı.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: Shadow
|
||||
- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10)
|
||||
- İçerik: Veri seti hazırlarken kök dizin boş bırakılırsa `.list` dosya yollarının otomatik okunması desteği eklendi.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)
|
||||
- İçerik: Windows 10 1909 ve Geleneksel Çince sistem dilinde GPT eğitiminin donma sorunu çözülmeye çalışıldı.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- İlgili: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232)
|
||||
- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)
|
||||
- İçerik: DPO Loss eğitim seçeneği eklendi (GPT tekrarlarını ve karakter atlamalarını azaltmak için), çıkarım WebUI'sına yeni parametreler eklendi.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: liufenghua
|
||||
- 2024.02.12 [Commit#2fa74ecb](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#d82f6bbb](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28)
|
||||
- İçerik: Faster Whisper ve FunASR mantığı optimize edildi, Hugging Face bağlantı sorunlarını önlemek için yansı indirmelere geçildi.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.15 [Commit#dd2c4d6d](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8)
|
||||
- İçerik: Eğitimde Çince deney adları desteklendi (önceki sürümlerde hata veriyordu).
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b)
|
||||
- İçerik: DPO eğitimi zorunlu olmaktan çıkarılıp seçmeli hale getirildi. Seçildiğinde batch boyutu otomatik yarıya indiriliyor. Çıkarım WebUI'sında yeni parametrelerin iletilmemesi sorunu düzeltildi.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5)
|
||||
- İçerik: Çince ön uç hataları düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499)
|
||||
- İçerik: Referans metin olmadan giriş yapma desteği eklendi.
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: Watchtower-Liu
|
||||
- İlgili: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475)
|
||||
- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559)
|
||||
- İçerik: Çince ve Japonca ön uç işleme optimizasyonları yapıldı.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: KamioRinn, v3cun
|
||||
- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511)
|
||||
- İçerik: Colab genel URL sorunu düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: ChanningWang2018, RVC-Boss
|
||||
- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557)
|
||||
- İçerik: Mac CPU çıkarımında MPS yerine CPU kullanılarak performans iyileştirildi.
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#5a171773](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35)
|
||||
- İçerik: Veri işleme sırasında gürültü azaltma seçeneği eklendi (sadece 16kHz örnekleme hızını korur, sadece yüksek arka plan gürültüsü varsa kullanılması önerilir).
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573)
|
||||
- İçerik: Mac'te CPU çıkarımının düzgün çalışması için `is_half` kontrolü düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610)
|
||||
- İçerik: UVR5 reverb kaldırma modelinde ayarların ters olması sorunu düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: Yuze Wang
|
||||
|
||||
1. Hubert çıkarımının NaN hatalarına neden olup SoVITS/GPT eğitiminde ZeroDivisionError'a yol açtığı sorun çözüldü.
|
||||
2. İnferans WebUI'de hızlı model değiştirme desteği eklendi.
|
||||
3. Model dosyası sıralama mantığı optimize edildi.
|
||||
4. Çince kelime ayrımı için `jieba` `jieba_fast` ile değiştirildi.
|
||||
## 202403
|
||||
|
||||
## 20240126
|
||||
- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675)
|
||||
- İçerik: CUDA yokken Faster Whisper için otomatik CPU çıkarımı etkinleştirildi
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: ShiroDoMain
|
||||
- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193)
|
||||
- İçerik: Faster Whisper Çince olmayan ASR kullanırken artık Çince FunASR modelini önceden indirmeye gerek yok
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- İçerik: Çıkarım hızı %50 iyileştirildi (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 ortamında test edildi)
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: GoHomeToMacDonal
|
||||
- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721)
|
||||
- İçerik: Hızlı çıkarım dalı 'fast_inference_' eklendi
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: ChasonJiang
|
||||
- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761)
|
||||
- İçerik: CPU ile eğitim desteği eklendi, macOS'ta CPU kullanarak eğitim yapılabilir
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: Lion-Wu
|
||||
- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821)
|
||||
- İçerik: İngilizce metin ön uç iyileştirmeleri
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894)
|
||||
- İçerik: API formatı geliştirildi
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
|
||||
1. Çince-İngilizce ve Japonca-İngilizce karışık çıktı metinleri için destek eklendi.
|
||||
2. Çıktı için isteğe bağlı bir bölme modu eklendi.
|
||||
3. UVR5'in dizinlerden otomatik olarak çıkmasına neden olan okuma sorununu düzelttik.
|
||||
4. Çeşitli yeni satır sorunlarını düzelterek çıkarım hatalarını giderdik.
|
||||
5. Çıkarım WebUI'deki gereksiz günlükleri kaldırdık.
|
||||
6. Mac'te eğitim ve çıkarım desteği eklendi.
|
||||
7. Yarım hassasiyeti desteklemeyen GPU'lar için otomatik olarak tek hassasiyet zorlandı; CPU çıkarımında tek hassasiyet uygulandı.
|
||||
## 202404
|
||||
|
||||
## 20240128
|
||||
- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917)
|
||||
- İçerik: UVR5 WebUI'da FFmpeg komut dizgisi biçimlendirmesi düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: StaryLan
|
||||
|
||||
1. Sayıların Çince karakterlere dönüştürülmesiyle ilgili sorunu düzelttik.
|
||||
2. Cümlelerin başındaki birkaç karakterin yutulması sorununu düzelttik.
|
||||
3. Mantıksız referans ses uzunluklarını sınırlamalar koyarak hariç tuttuk.
|
||||
4. GPT eğitiminin kontrol noktalarını kaydetmemesi sorununu düzelttik.
|
||||
5. Dockerfile'da model indirme sürecini tamamladık.
|
||||
## 202405
|
||||
|
||||
## 20240129
|
||||
- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953)
|
||||
- İçerik: SoVITS eğitiminde VQ'nun dondurulmamasından kaynaklanan kalite düşüşü sorunu çözüldü
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: hcwu1993
|
||||
- İlgili: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747)
|
||||
- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102)
|
||||
- İçerik: Eğitim verisi işleme sırasında desteklenmeyen diller için hata mesajı eklendi
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: StaryLan
|
||||
- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132)
|
||||
- İçerik: Hubert çıkarım hatası düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
|
||||
1. Yarım hassasiyet eğitimi ile ilgili sorun yaşayan 16 serisi gibi GPU'lar için eğitim yapılandırmalarını tek hassasiyete değiştirdik.
|
||||
2. Mevcut Colab sürümünü test ettik ve güncelledik.
|
||||
3. Eski sürüm FunASR ile ModelScope FunASR deposunun git klonlanmasıyla oluşan arayüz hizalama hatalarını düzelttik.
|
||||
## 202406
|
||||
|
||||
## 20240130
|
||||
- 2024.06.06 [Commit#99f09c8b](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a)
|
||||
- İçerik: WebUI'da GPT ince ayarında Çince metinlerin BERT özelliklerinin okunmaması nedeniyle çıkarım tutarsızlığı ve kalite düşüşü sorunu düzeltildi
|
||||
**Uyarı: Daha önce büyük miktarda veriyle ince ayar yaptıysanız, kaliteyi artırmak için modeli yeniden ayarlamanız önerilir**
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159)
|
||||
- İçerik: `s2_train.py` dosyasında SoVITS eğitim ilerleme çubuğu mantığı düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: pengzhendong
|
||||
- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232)
|
||||
- İçerik: UVR5 MDXNet'in FFmpeg çağrılarında boşluk içeren yollarla uyumlu olması için dize biçimlendirme düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169)
|
||||
- İçerik: Saf noktalama işaretleri ve çoklu noktalama işaretli metin girişi işleme mantığı iyileştirildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- İlgili: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165)
|
||||
- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041)
|
||||
- İçerik: CPU çıkarımında varsayılan batch boyutu ondalık sorunu düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267)
|
||||
- İçerik: Gürültü azaltma veya ASR işlemi sırasında istisna oluştuğunda bekleyen tüm ses dosyalarının kapanması sorunu düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca)
|
||||
- İçerik: Çoklu GPU eğitiminde çoklu işlem kayıt mantığı düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251)
|
||||
- İçerik: Yinelenen `my_utils.py` dosyası kaldırıldı
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: aoguai
|
||||
- İlgili: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189)
|
||||
|
||||
1. Çift tırnaklarla yol kopyalama hatalarını önlemek için tüm yol ile ilgili girdilerden otomatik olarak çift tırnakları kaldırdık.
|
||||
2. Çince ve İngilizce noktalama işaretlerini ayırma sorunlarını düzelttik ve cümlelerin başına ve sonuna noktalama işaretleri ekledik.
|
||||
3. Noktalama işaretlerine göre ayırma özelliğini ekledik.
|
||||
## 202407
|
||||
|
||||
## 20240201
|
||||
|
||||
1. Ayrılma hatalarına neden olan UVR5 format okuma hatasını düzelttik.
|
||||
2. Karışık Çince-Japonca-İngilizce metinler için otomatik segmentasyon ve dil tanıma desteği sağladık.
|
||||
|
||||
## 20240202
|
||||
|
||||
1. `/` ile biten bir ASR yolunun dosya adını kaydetme hatasına neden olma sorununu düzelttik.
|
||||
2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) PaddleSpeech'in Normalizer'ını tanıtarak "xx.xx%" (yüzde sembolleri) ve "元/吨" ifadesinin "元吨" yerine "元每吨" olarak okunması gibi sorunları düzelttik ve alt çizgi hatalarını giderdik.
|
||||
|
||||
## 20240207
|
||||
|
||||
1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)de bildirilen dil parametresi karışıklığının Çinçe çıkarım kalitesini düşürme sorununu düzelttik.
|
||||
2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) ile UVR5'i daha yüksek versiyonlarda librosa'ya uyarladık.
|
||||
3. [Commit 14a2851](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) `is_half` parametresinin booleana dönüştürülmemesi nedeniyle sürekli yarım hassasiyet çıkarımı yaparak 16 serisi GPU'larda `inf` hatasına neden olan UVR5 inf hatasını düzelttik.
|
||||
4. İngilizce metin önyüzünü optimize ettik.
|
||||
5. Gradio bağımlılıklarını düzelttik.
|
||||
6. Veri seti hazırlığı sırasında kök dizini boş bırakıldığında `.list` tam yollarının otomatik olarak okunmasını destekledik.
|
||||
7. Japonca ve İngilizce için Faster Whisper ASR'yi entegre ettik.
|
||||
|
||||
## 20240208
|
||||
|
||||
1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) ile Windows 10 1909'da ve [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232)de (Geleneksel Çince Sistem Dili) bildirilen GPT eğitim durma sorununu düzeltmeye çalıştık.
|
||||
|
||||
## 20240212
|
||||
|
||||
1. Faster Whisper ve FunASR için mantığı optimize ettik, Hugging Face bağlantı sorunlarını önlemek için Faster Whisper'ı ayna indirmelere yönlendirdik.
|
||||
2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) GPT tekrarı ve eksik karakterleri azaltmak için eğitim sırasında negatif örnekler oluşturarak deneysel DPO Loss eğitim seçeneğini etkinleştirdi ve çıkarım WebUI'de çeşitli çıkarım parametrelerini kullanılabilir hale getirdi.
|
||||
|
||||
## 20240214
|
||||
|
||||
1. Eğitimde Çince deney adlarını destekledik (önceden hatalara neden oluyordu).
|
||||
2. DPO eğitimini zorunlu yerine isteğe bağlı bir özellik yaptık. Seçilirse, parti boyutu otomatik olarak yarıya indirilir. Çıkarım WebUI'de yeni parametrelerin iletilmemesi sorunlarını düzelttik.
|
||||
|
||||
## 20240216
|
||||
|
||||
1. Referans metin olmadan girişi destekledik.
|
||||
2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) de bildirilen Çince önyüz hatalarını düzelttik.
|
||||
|
||||
## 20240221
|
||||
|
||||
1. Veri işleme sırasında bir gürültü azaltma seçeneği ekledik (gürültü azaltma sadece 16kHz örnekleme hızını bırakır; yalnızca arka plan gürültüsü önemliyse kullanın).
|
||||
2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) ile Çince ve Japonca önyüz işlemesini optimize ettik.
|
||||
3. Mac CPU çıkarımını daha hızlı performans için MPS yerine CPU kullanacak şekilde değiştirdik.
|
||||
4. Colab genel URL sorununu düzelttik.
|
||||
|
||||
## 20240306
|
||||
|
||||
1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) çıkarımı %50 hızlandırdı (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 üzerinde test edildi).
|
||||
2. Faster Whisper'ın Çince olmayan ASR'sini kullanırken artık önce Çin FunASR modelini indirmeyi gerektirmiyor.
|
||||
3. [PR 610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) UVR5 yankı giderme modelindeki ayarın tersine çevrildiği sorunu düzeltti.
|
||||
4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) CUDA mevcut olmadığında Faster Whisper için otomatik CPU çıkarımını etkinleştirdi.
|
||||
5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) Mac'te doğru CPU çıkarımı sağlamak için `is_half` kontrolünü değiştirdi.
|
||||
|
||||
## 202403/202404/202405 Güncellemeleri
|
||||
|
||||
### Küçük Düzeltmeler:
|
||||
|
||||
1. Referans metin olmayan mod ile ilgili sorunlar düzeltildi.
|
||||
2. Çince ve İngilizce metin önyüzü optimize edildi.
|
||||
3. API formatı iyileştirildi.
|
||||
4. CMD format sorunları düzeltildi.
|
||||
5. Eğitim verisi işleme sırasında desteklenmeyen diller için hata uyarıları eklendi.
|
||||
6. Hubert çıkarımındaki hata düzeltildi.
|
||||
|
||||
### Büyük Düzeltmeler:
|
||||
|
||||
1. VQ'yu dondurmadan yapılan SoVITS eğitimi sorunu (bu kalite düşüşüne neden olabilir) düzeltildi.
|
||||
2. Hızlı çıkarım dalı eklendi.
|
||||
|
||||
## 20240610
|
||||
|
||||
### Küçük Düzeltmeler:
|
||||
|
||||
1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) saf noktalama işareti ve çoklu noktalama işareti metin girdisi için mantığı geliştirdi.
|
||||
2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) UVR5'teki MDXNet yankı giderme için CMD formatını düzeltti, boşluk içeren yolları destekledi.
|
||||
3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) `s2_train.py` içindeki SoVITS eğitimi için ilerleme çubuğu mantığını düzeltti.
|
||||
|
||||
### Büyük Düzeltmeler:
|
||||
|
||||
4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) WebUI'nin GPT ince ayarının, Çince giriş metinlerinin BERT özelliğini okumaması sorununu düzeltti, bu da çıkarım ile tutarsızlığa ve potansiyel kalite düşüşüne neden oluyordu.
|
||||
**Dikkat: Daha önce büyük miktarda veri ile ince ayar yaptıysanız, modelin kalitesini artırmak için yeniden ayar yapmanız önerilir.**
|
||||
|
||||
## 20240706
|
||||
|
||||
### Küçük Düzeltmeler:
|
||||
|
||||
1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) CPU çıkarımında varsayılan yığın boyutu ondalık sorununu düzeltti.
|
||||
2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) gürültü giderme veya ASR ile ilgili istisnalarla karşılaşıldığında bekleyen tüm ses dosyalarının çıkış yapmasına neden olan sorunları düzeltti.
|
||||
3. [PR 1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) noktalama işaretlerine göre ayrılırken ondalıkların bölünmesi sorununu düzeltti.
|
||||
4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) çoklu GPU eğitimi için çoklu işlem kaydetme mantığını düzeltti.
|
||||
5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) gereksiz `my_utils`'ı kaldırdı.
|
||||
|
||||
### Büyük Düzeltmeler:
|
||||
|
||||
6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) hızlandırılmış çıkarım kodu doğrulandı ve ana dala birleştirildi, taban ile tutarlı çıkarım etkileri sağlandı.
|
||||
Ayrıca referans metni olmayan modda hızlandırılmış çıkarımı destekler.
|
||||
|
||||
**Gelecek güncellemeler, `fast_inference` dalındaki değişikliklerin tutarlılığını doğrulamaya devam edecek.**
|
||||
|
||||
## 20240727
|
||||
|
||||
### Küçük Düzeltmeler:
|
||||
|
||||
1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) gereksiz i18n kodlarını temizledi.
|
||||
2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) kullanıcı dosya yollarındaki sonlandırma eğik çizgilerinin komut satırı hatalarına neden olduğu sorunları düzeltti.
|
||||
3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) GPT eğitimindeki adım hesaplama mantığını düzeltti.
|
||||
|
||||
### Büyük Düzeltmeler:
|
||||
|
||||
4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) sentez için konuşma hızı ayarlamasını destekledi.
|
||||
Konuşma hızını ayarlarken rastgeleliği dondurmayı etkinleştirdi.
|
||||
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): BS-RoFormer vokal eşlik ayırma modeli desteği eklendi.
|
||||
- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253)
|
||||
- İçerik: Noktalama işaretlerine göre bölme işlemi sırasında ondalık sayıların bölünmesi sorunu düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: aoguai
|
||||
- 2024.07.06 [Commit#b0786f29](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5)
|
||||
- İçerik: Hızlandırılmış çıkarım kodu doğrulandı ve ana dal ile birleştirildi. Temel sürümle aynı çıkarım etkisi garanti edilirken referans metni olmayan modda da hızlandırılmış çıkarım destekleniyor
|
||||
- Tür: Optimizasyon
|
||||
- Katkıda Bulunan: RVC-Boss, GoHomeToMacDonal
|
||||
- İlgili: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)
|
||||
- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298)
|
||||
- İçerik: i18n taraması yeniden düzenlendi ve çok dilli yapılandırma dosyaları güncellendi
|
||||
- Tür: Dokümantasyon
|
||||
- Katkıda Bulunan: StaryLan
|
||||
- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299)
|
||||
- İçerik: Kullanıcı dosya yollarındaki son eğik çizgilerin neden olduğu komut satırı hataları düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756)
|
||||
- İçerik: GPT eğitiminde özel `bucket_sampler` kullanılırken eğitim adımlarında tutarsızlık sorunu düzeltildi
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: huangxu1991
|
||||
- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340)
|
||||
- İçerik: Sentez sırasında konuşma hızı ayarlama özelliği eklendi (rastgeleliği sabitleme ve sadece hızı kontrol etme seçeneği dahil). Bu özellik `api.py` dosyasına eklendi
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: RVC-Boss, 红血球AE3803
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356)
|
||||
- İçerik: BS-RoFormer vokal eşlik ayırma modeli desteği eklendi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): Çince metin ön işleme iyileştirildi.
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351)
|
||||
- İçerik: Çince metin ön işleme iyileştirildi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
|
||||
## 202408 (V2 Sürümü)
|
||||
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): WebUI'de dosya işlerken yolların otomatik doldurulması.
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355)
|
||||
- İçerik: WebUI'de dosya işlerken yolların otomatik doldurulması.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): BS-Roformer için FP16 çıkarım desteği etkinleştirildi.
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c)
|
||||
- İçerik: BS-Roformer için FP16 çıkarım desteği etkinleştirildi.
|
||||
- Tür: Performans Optimizasyonu
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): GPU tanıma mantığı optimize edildi, kullanıcıların girdiği rastgele GPU indekslerini işlemek için kullanıcı dostu mantık eklendi.
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78)
|
||||
- İçerik: GPU tanıma mantığı optimize edildi, kullanıcıların girdiği rastgele GPU indekslerini işlemek için kullanıcı dostu mantık eklendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **GPT-SoVITS V2 modeli eklendi.**
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758)
|
||||
- İçerik: **GPT-SoVITS V2 modeli eklendi.**
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): FunASR kullanarak Kantonca ASR desteği eklendi.
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3)
|
||||
- İçerik: FunASR kullanarak Kantonca ASR desteği eklendi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): UI ve zamanlama mantığı optimize edildi.
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388)
|
||||
- İçerik: UI ve zamanlama mantığı optimize edildi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): Çok sesli karakter işleme mantığı optimize edildi (Yalnızca V2).
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488)
|
||||
- İçerik: Çok sesli karakter işleme mantığı optimize edildi (Yalnızca V2).
|
||||
- Tür: Düzeltme, Yeni Özellik
|
||||
- Katkıda Bulunan: KamioRinn, RVC-Boss
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): Yalnızca bir referans ses yüklenebilme hatası düzeltildi; eksik dosyalar için uyarı açılır pencereleriyle veri seti doğrulama eklendi.
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422)
|
||||
- İçerik: Yalnızca bir referans ses yüklenebilme hatası düzeltildi; eksik dosyalar için uyarı açılır pencereleriyle veri seti doğrulama eklendi.
|
||||
- Tür: Düzeltme, Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): Yukarı akış LangSegment kütüphanesi artık SSML etiketleri kullanarak sayıları, telefon numaralarını, tarihleri ve saatleri optimize ediyor.
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508)
|
||||
- İçerik: Yukarı akış LangSegment kütüphanesi artık SSML etiketleri kullanarak sayıları, telefon numaralarını, tarihleri ve saatleri optimize ediyor.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: juntaosun
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): API düzeltildi ve optimize edildi.
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503)
|
||||
- İçerik: API düzeltildi ve optimize edildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): `fast_inference` dalı ana dala birleştirildi.
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490)
|
||||
- İçerik: `fast_inference` dalı ana dala birleştirildi.
|
||||
- Tür: Yeniden Yapılandırma
|
||||
- Katkıda Bulunan: ChasonJiang
|
||||
- 2024.08.21 **GPT-SoVITS V2 sürümü resmi olarak yayınlandı.**
|
||||
|
||||
## 202502 (V3 Sürümü)
|
||||
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **İnce ayar için 14GB VRAM gerektiren GPT-SoVITS V3 modeli eklendi.**
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4)
|
||||
- İçerik: **İnce ayar için 14GB VRAM gerektiren GPT-SoVITS V3 modeli eklendi.**
|
||||
- Tür: Yeni Özellik ([Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)) referans)
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): Çok dilli proje dokümantasyonu güncellendi.
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032)
|
||||
- İçerik: Çok dilli proje dokümantasyonu güncellendi.
|
||||
- Tür: Dokümantasyon
|
||||
- Katkıda Bulunan: StaryLan
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): Japonca dokümantasyon güncellendi.
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033)
|
||||
- İçerik: Japonca dokümantasyon güncellendi.
|
||||
- Tür: Dokümantasyon
|
||||
- Katkıda Bulunan: Fyphen
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): Dikkat hesaplama mantığı optimize edildi.
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010)
|
||||
- İçerik: Dikkat hesaplama mantığı optimize edildi.
|
||||
- Tür: Performans Optimizasyonu
|
||||
- Katkıda Bulunan: wzy3650
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): İnce ayar için gradyan kontrol noktası desteği eklendi (12GB VRAM gerektirir).
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040)
|
||||
- İçerik: İnce ayar için gradyan kontrol noktası desteği eklendi (12GB VRAM gerektirir).
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: Kakaru Hayate
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): Yeni dil bölümleme aracına geçildi, çok dilli karışık metin bölme stratejisi iyileştirildi, sayı ve İngilizce işleme mantığı optimize edildi.
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073)
|
||||
- İçerik: Yeni dil bölümleme aracına geçildi, çok dilli karışık metin bölme stratejisi iyileştirildi, sayı ve İngilizce işleme mantığı optimize edildi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 modeli artık LoRA eğitimini destekliyor (ince ayar için 8GB GPU Belleği gerektirir).**
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e)
|
||||
- İçerik: **GPT-SoVITS V3 modeli artık LoRA eğitimini destekliyor (ince ayar için 8GB GPU Belleği gerektirir).**
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): Vokal ve enstrüman ayırma için Mel Band Roformer model desteği eklendi.
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078)
|
||||
- İçerik: Vokal ve enstrüman ayırma için Mel Band Roformer model desteği eklendi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: Sucial
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): Çince yollarda MeCab hatası düzeltildi (özel olarak Japonca/Korece veya çok dilli metin bölme için).
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114)
|
||||
- İçerik: Çince yollarda MeCab hatası düzeltildi (özel olarak Japonca/Korece veya çok dilli metin bölme için).
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): V3 modeliyle 24K ses üretirken "boğuk" ses sorununu hafifletmek için **24kHz'den 48kHz'e ses süper çözünürlük modelleri eklendi**.
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc)
|
||||
- İçerik: V3 modeliyle 24K ses üretirken "boğuk" ses sorununu hafifletmek için **24kHz'den 48kHz'e ses süper çözünürlük modelleri eklendi**.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- İlgili: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): Çok dilli proje dokümantasyonu güncellendi.
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123)
|
||||
- İçerik: Çok dilli proje dokümantasyonu güncellendi.
|
||||
- Tür: Dokümantasyon
|
||||
- Katkıda Bulunan: StaryLan
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): Model tanımlayamadığında kısa CJK karakterleri için kural tabanlı tespit uygulandı.
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122)
|
||||
- İçerik: Model tanımlayamadığında kısa CJK karakterleri için kural tabanlı tespit uygulandı.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- İlgili: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116)
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): Sentez hızını kontrol etmek için konuşma hızı parametresi eklendi.
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5)
|
||||
- İçerik: Sentez hızını kontrol etmek için konuşma hızı parametresi eklendi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.02.28 **GPT-SoVITS V3 resmi olarak yayınlandı**.
|
||||
|
||||
## 202503
|
||||
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): Bağımlılıkların yanlış sürümlerinden kaynaklanan sorunlar düzeltildi.
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236)
|
||||
- İçerik: Bağımlılıkların yanlış sürümlerinden kaynaklanan sorunlar düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- İlgili:
|
||||
@@ -264,7 +474,8 @@
|
||||
- ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841).
|
||||
- Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239).
|
||||
- PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174).
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **SoVITS v3 için paralel çıkarım etkinleştirildi.**
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241)
|
||||
- İçerik: **SoVITS v3 için paralel çıkarım etkinleştirildi.**
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: ChasonJiang
|
||||
|
||||
@@ -278,56 +489,92 @@
|
||||
|
||||
## 202504 (V4 Sürümü)
|
||||
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): SoVITS v3 paralel çıkarımı kilit açıldı; asenkron model yükleme mantığı düzeltildi.
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f)
|
||||
- İçerik: SoVITS v3 paralel çıkarımı kilit açıldı; asenkron model yükleme mantığı düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruff ile kod biçimlendirme; G2PW bağlantısı güncellendi.
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255)
|
||||
- İçerik: Ruff ile kod biçimlendirme; G2PW bağlantısı güncellendi.
|
||||
- Tür: Stil
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): Dokümantasyon temizlendi; Python 3.11 desteği eklendi; yükleyiciler güncellendi.
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290)
|
||||
- İçerik: Dokümantasyon temizlendi; Python 3.11 desteği eklendi; yükleyiciler güncellendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Colab, kurulum dosyaları ve model indirmeleri güncellendi.
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300)
|
||||
- İçerik: Colab, kurulum dosyaları ve model indirmeleri güncellendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **GPT-SoVITS V4 modeli eklendi.**
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf)
|
||||
- İçerik: **GPT-SoVITS V4 modeli eklendi.**
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): V4 için paralel çıkarım etkinleştirildi.
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307)
|
||||
- İçerik: V4 için paralel çıkarım etkinleştirildi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): Model sürümü parametre aktarımı düzeltildi.
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309)
|
||||
- İçerik: Model sürümü parametre aktarımı düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): Numpy ve Numba sürüm uyumsuzluğu sorunu düzeltildi; librosa sürümü güncellendi.
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310)
|
||||
- İçerik: Numpy ve Numba sürüm uyumsuzluğu sorunu düzeltildi; librosa sürümü güncellendi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss, XXXXRT666
|
||||
- İlgili: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308)
|
||||
- **2025.04.22 GPT-SoVITS V4 resmi olarak yayınlandı**.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Gradio parametreleri güncellendi.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311)
|
||||
- İçerik: Gradio parametreleri güncellendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Colab/Kaggle notebook betikleri iyileştirildi.
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322)
|
||||
- İçerik: Colab/Kaggle notebook betikleri iyileştirildi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
|
||||
## 202505
|
||||
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): Docker ve Windows otomatik derleme betikleri iyileştirildi; ön işleme biçimlendirme eklendi.
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351)
|
||||
- İçerik: Docker ve Windows otomatik derleme betikleri iyileştirildi; ön işleme biçimlendirme eklendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): Çok dilli metin bölme ve tanıma mantığı optimize edildi.
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408)
|
||||
- İçerik: Çok dilli metin bölme ve tanıma mantığı optimize edildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- İlgili: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404)
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): SoVITS V3/V4 çıkarım hızını %10 artırmak için önbellekleme stratejileri uygulandı.
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377)
|
||||
- İçerik: SoVITS V3/V4 çıkarım hızını %10 artırmak için önbellekleme stratejileri uygulandı.
|
||||
- Tür: Performans Optimizasyonu
|
||||
- Katkıda Bulunan: Kakaru Hayate
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): Açıklama arayüzü uyarı ile güncellendi: her sayfa tamamlandıktan sonra "Metni Gönder"e tıklayın, aksi takdirde değişiklikler kaydedilmez.
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba)
|
||||
- İçerik: Açıklama arayüzü uyarı ile güncellendi: her sayfa tamamlandıktan sonra "Metni Gönder"e tıklayın, aksi takdirde değişiklikler kaydedilmez.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): UVR5 ve ONNX yankı giderme modellerinde, FFmpeg'in orijinal yollarında boşluk bulunan MP3/M4A dosyalarını kodlarken oluşan hatalar düzeltildi.
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc)
|
||||
- İçerik: UVR5 ve ONNX yankı giderme modellerinde, FFmpeg'in orijinal yollarında boşluk bulunan MP3/M4A dosyalarını kodlarken oluşan hatalar düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
|
||||
**Önizleme: Ejderha Teknesi Festivali'nden sonra V2 sürümüne dayalı büyük optimizasyon güncellemesi gelecek!**
|
||||
## 202506 (V2Pro Serisi)
|
||||
|
||||
- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420)
|
||||
- İçerik: Çok dilli proje dokümantasyonu güncellendi
|
||||
- Tür: Dokümantasyon
|
||||
- Katkıda Bulunan: StaryLan
|
||||
- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417)
|
||||
- İçerik: TorchScript ile V4 dışa aktarma desteği eklendi
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: L-jasmine
|
||||
- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70)
|
||||
- İçerik: **GPT-SoVITS V2Pro Serisi model eklendi (V2Pro, V2ProPlus)**
|
||||
- Tür: Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426)
|
||||
- İçerik: `config/inference_webui` başlatma hatası düzeltildi
|
||||
- Tür: Hata Düzeltme
|
||||
- Katkıda Bulunan: StaryLan
|
||||
- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434)
|
||||
- İçerik: Otomatik hassasiyet algılama mantığı optimize edildi; WebUI önyüz modüllerine katlanabilir özellik eklendi
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunanlar: XXXXRT666, RVC-Boss
|
||||
|
||||
@@ -285,7 +285,7 @@ V1 ortamından V2'yi kullanmak için:
|
||||
|
||||
## V3 Sürüm Notları
|
||||
|
||||
### Yeni Özellikler:
|
||||
Yeni Özellikler:
|
||||
|
||||
1. **Tını benzerliği** daha yüksek olup, hedef konuşmacıyı yakınsamak için daha az eğitim verisi gerekmektedir (tını benzerliği, base model doğrudan kullanılacak şekilde fine-tuning yapılmadan önemli ölçüde iyileştirilmiştir).
|
||||
|
||||
@@ -293,7 +293,7 @@ V1 ortamından V2'yi kullanmak için:
|
||||
|
||||
[daha fazla detay](<https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)>)
|
||||
|
||||
### v2 ortamında v3 kullanımı:
|
||||
V2 ortamında V3 kullanımı:
|
||||
|
||||
1. `pip install -r requirements.txt` ile bazı paketleri güncelleyin.
|
||||
|
||||
@@ -303,6 +303,38 @@ V1 ortamından V2'yi kullanmak için:
|
||||
|
||||
ek: Ses Süper Çözünürlük modeli için [nasıl indirileceği](../../tools/AP_BWE_main/24kto48k/readme.txt) hakkında bilgi alabilirsiniz.
|
||||
|
||||
## V4 Sürüm Notları
|
||||
|
||||
Yeni Özellikler:
|
||||
|
||||
1. **V4, V3'te görülen non-integer upsample işleminden kaynaklanan metalik ses sorununu düzeltti ve sesin boğuklaşmasını önlemek için doğrudan 48kHz ses çıktısı sunar (V3 sadece 24kHz destekler)**. Yazar, V4'ün V3'ün yerine geçebileceğini belirtmiştir ancak daha fazla test yapılması gerekmektedir.
|
||||
[Daha fazla bilgi](<https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3v4%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)>)
|
||||
|
||||
V1/V2/V3 ortamından V4'e geçiş:
|
||||
|
||||
1. Bazı bağımlılıkları güncellemek için `pip install -r requirements.txt` komutunu çalıştırın.
|
||||
|
||||
2. GitHub'dan en son kodları klonlayın.
|
||||
|
||||
3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) üzerinden V4 ön eğitilmiş modelleri indirin (`gsv-v4-pretrained/s2v4.ckpt` ve `gsv-v4-pretrained/vocoder.pth`) ve bunları `GPT_SoVITS/pretrained_models` dizinine koyun.
|
||||
|
||||
## V2Pro Sürüm Notları
|
||||
|
||||
Yeni Özellikler:
|
||||
|
||||
1. **V2 ile karşılaştırıldığında biraz daha yüksek VRAM kullanımı sağlar ancak V4'ten daha iyi performans gösterir; aynı donanım maliyeti ve hız avantajını korur**.
|
||||
[Daha fazla bilgi](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90features-(%E5%90%84%E7%89%88%E6%9C%AC%E7%89%B9%E6%80%A7))
|
||||
|
||||
2. V1/V2 ve V2Pro serisi benzer özelliklere sahipken, V3/V4 de yakın işlevleri paylaşır. Ortalama kalite düşük olan eğitim setleriyle V1/V2/V2Pro iyi sonuçlar verebilir ama V3/V4 veremez. Ayrıca, V3/V4’ün ürettiği ses tonu genel eğitim setine değil, referans ses örneğine daha çok benzemektedir.
|
||||
|
||||
V1/V2/V3/V4 ortamından V2Pro'ya geçiş:
|
||||
|
||||
1. Bazı bağımlılıkları güncellemek için `pip install -r requirements.txt` komutunu çalıştırın.
|
||||
|
||||
2. GitHub'dan en son kodları klonlayın.
|
||||
|
||||
3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) üzerinden V2Pro ön eğitilmiş modelleri indirin (`v2Pro/s2Dv2Pro.pth`, `v2Pro/s2Gv2Pro.pth`, `v2Pro/s2Dv2ProPlus.pth`, `v2Pro/s2Gv2ProPlus.pth`, ve `sv/pretrained_eres2netv2w24s4ep4.ckpt`) ve bunları `GPT_SoVITS/pretrained_models` dizinine koyun.
|
||||
|
||||
## Yapılacaklar Listesi
|
||||
|
||||
- [x] **Yüksek Öncelikli:**
|
||||
@@ -385,6 +417,7 @@ python ./tools/asr/fasterwhisper_asr.py -i <girdi> -o <çıktı> -l <dil>
|
||||
- [Chinese Speech Pretrain](https://github.com/TencentGameMate/chinese_speech_pretrain)
|
||||
- [Chinese-Roberta-WWM-Ext-Large](https://huggingface.co/hfl/chinese-roberta-wwm-ext-large)
|
||||
- [BigVGAN](https://github.com/NVIDIA/BigVGAN)
|
||||
- [eresnetv2](https://modelscope.cn/models/iic/speech_eres2netv2w24s4ep4_sv_zh-cn_16k-common)
|
||||
|
||||
### Tahmin İçin Metin Ön Ucu
|
||||
|
||||
|
||||
Reference in New Issue
Block a user