为api_v2和inference_webui_fast适配V3版本 (#2188)

* modified: GPT_SoVITS/TTS_infer_pack/TTS.py modified: GPT_SoVITS/TTS_infer_pack/TextPreprocessor.py modified: GPT_SoVITS/inference_webui_fast.py * 适配V3版本 * api_v2.py和inference_webui_fast.py的v3适配 * 修改了个远古bug,增加了更友好的提示信息 * 优化webui * 修改为正确的path * 修复v3 lora模型的载入问题 * 修复读取tts_infer.yaml文件时遇到的编码不匹配的问题
2025-03-26 14:34:51 +08:00
parent 165882d64f
commit 7394dc7b0c
12 changed files with 486 additions and 146 deletions
--- a/GPT_SoVITS/BigVGAN/alias_free_activation/torch/act.py
+++ b/GPT_SoVITS/BigVGAN/alias_free_activation/torch/act.py
@@ -2,7 +2,7 @@
 #   LICENSE is in incl_licenses directory.

 import torch.nn as nn
-from alias_free_activation.torch.resample import UpSample1d, DownSample1d
+from .resample import UpSample1d, DownSample1d


 class Activation1d(nn.Module):
--- a/GPT_SoVITS/BigVGAN/alias_free_activation/torch/resample.py
+++ b/GPT_SoVITS/BigVGAN/alias_free_activation/torch/resample.py
@@ -3,8 +3,8 @@

 import torch.nn as nn
 from torch.nn import functional as F
-from alias_free_activation.torch.filter import LowPassFilter1d
-from alias_free_activation.torch.filter import kaiser_sinc_filter1d
+from .filter import LowPassFilter1d
+from .filter import kaiser_sinc_filter1d


 class UpSample1d(nn.Module):
--- a/GPT_SoVITS/BigVGAN/bigvgan.py
+++ b/GPT_SoVITS/BigVGAN/bigvgan.py
@@ -14,10 +14,10 @@ import torch.nn as nn
 from torch.nn import Conv1d, ConvTranspose1d
 from torch.nn.utils import weight_norm, remove_weight_norm

-import activations
-from utils0 import init_weights, get_padding
-from alias_free_activation.torch.act import Activation1d as TorchActivation1d
-from env import AttrDict
+from . import activations
+from .utils0 import init_weights, get_padding
+from .alias_free_activation.torch.act import Activation1d as TorchActivation1d
+from .env import AttrDict

 from huggingface_hub import PyTorchModelHubMixin, hf_hub_download

@@ -93,7 +93,7 @@ class AMPBlock1(torch.nn.Module):

        # Select which Activation1d, lazy-load cuda version to ensure backward compatibility
        if self.h.get("use_cuda_kernel", False):
-            from alias_free_activation.cuda.activation1d import (
+            from .alias_free_activation.cuda.activation1d import (
                Activation1d as CudaActivation1d,
            )

@@ -193,7 +193,7 @@ class AMPBlock2(torch.nn.Module):

        # Select which Activation1d, lazy-load cuda version to ensure backward compatibility
        if self.h.get("use_cuda_kernel", False):
-            from alias_free_activation.cuda.activation1d import (
+            from .alias_free_activation.cuda.activation1d import (
                Activation1d as CudaActivation1d,
            )

@@ -271,7 +271,7 @@ class BigVGAN(

        # Select which Activation1d, lazy-load cuda version to ensure backward compatibility
        if self.h.get("use_cuda_kernel", False):
-            from alias_free_activation.cuda.activation1d import (
+            from .alias_free_activation.cuda.activation1d import (
                Activation1d as CudaActivation1d,
            )

--- a/GPT_SoVITS/BigVGAN/meldataset.py
+++ b/GPT_SoVITS/BigVGAN/meldataset.py
@@ -15,7 +15,7 @@ from librosa.filters import mel as librosa_mel_fn
 import pathlib
 from tqdm import tqdm
 from typing import List, Tuple, Optional
-from env import AttrDict
+from .env import AttrDict

 MAX_WAV_VALUE = 32767.0  # NOTE: 32768.0 -1 to prevent int16 overflow (results in popping sound in corner cases)

--- a/GPT_SoVITS/BigVGAN/utils0.py
+++ b/GPT_SoVITS/BigVGAN/utils0.py
@@ -9,7 +9,7 @@ from torch.nn.utils import weight_norm

 matplotlib.use("Agg")
 import matplotlib.pylab as plt
-from meldataset import MAX_WAV_VALUE
+from .meldataset import MAX_WAV_VALUE
 from scipy.io.wavfile import write