Spaces:

AIDC-AI
/

Marco-Voice-TTS

Running

tianfengping.tfp commited on 10 days ago

Commit

bd90cd9

1 Parent(s): 26613c2

delete speed

Files changed (1) hide show

app.py CHANGED Viewed

@@ -237,9 +237,9 @@ def generate_speech_speakerminus(tts_text, speed, speaker, key, ref_audio, ref_t
         # speaker=speaker,
         prompt_speech_16k = ref_audio,
         key = emo.get(key),
-        emotion_speakerminus=emotion_info,
         # ref_audio = ref_audio,
-        speed=speed
     )
     print("sample_rate:", sample_rate, "full_audio:", full_audio.min(), full_audio.max())
@@ -257,7 +257,6 @@ def generate_speech_speakerminus(tts_text, speed, speaker, key, ref_audio, ref_t
 def generate_speech_sft(tts_text, speed, speaker, key, ref_audio, ref_text):
-    # import pdb;pdb.set_trace()
     global tts_sft_global, local_model_path_enhenced
     # Ensure models are downloaded (this may take time on first use)
     if local_model_path_enhenced is None:
@@ -323,9 +322,9 @@ def generate_speech_sft(tts_text, speed, speaker, key, ref_audio, ref_text):
         # speaker=speaker,
         prompt_speech_16k = ref_audio,
         key = emo.get(key),
-        emotion_speakerminus=emotion_info,
         # ref_audio = ref_audio,
-        speed=speed
     )
     print("sample_rate:", sample_rate, "full_audio:", full_audio.min(), full_audio.max())

         # speaker=speaker,
         prompt_speech_16k = ref_audio,
         key = emo.get(key),
+        emotion_embedding=emotion_info,
         # ref_audio = ref_audio,
+        # speed=speed
     )
     print("sample_rate:", sample_rate, "full_audio:", full_audio.min(), full_audio.max())
 def generate_speech_sft(tts_text, speed, speaker, key, ref_audio, ref_text):
     global tts_sft_global, local_model_path_enhenced
     # Ensure models are downloaded (this may take time on first use)
     if local_model_path_enhenced is None:
         # speaker=speaker,
         prompt_speech_16k = ref_audio,
         key = emo.get(key),
+        emotion_embedding=emotion_info,
         # ref_audio = ref_audio,
+        # speed=speed
     )
     print("sample_rate:", sample_rate, "full_audio:", full_audio.min(), full_audio.max())