Spaces:

RobotsMali
/

RobotsMali_ASR_DEMO

Sleeping

App Files Files Community

binaryMao commited on Oct 16

Commit

65d9e15

verified ·

1 Parent(s): 6003a07

Update app.py

Browse files

Files changed (1) hide show

app.py +57 -35

app.py CHANGED Viewed

@@ -1,23 +1,20 @@
 # -*- coding: utf-8 -*-
 """RobotsMali_ASR_Demo.ipynb
 Automatically generated by Colab.
 Original file is located at
     https://colab.research.google.com/drive/1fCpSvqwoSbpEBC62cZrQuqQGr4U1BNsh
 """
 import gradio as gr
 from transformers import pipeline
 import time
 # ----------------------------------------------------------------------
 # 1. CONFIGURATION DES MODÈLES
 # ----------------------------------------------------------------------
 # Liste des identifiants exacts des modèles RobotsMali
 ROBOTSMALI_MODELS = [
-    "RobotsMali/soloba-ctc-0.6b-v0",
     "RobotsMali/soloni-114m-tdt-ctc-v1",
     "RobotsMali/soloni-114m-tdt-ctc-V0",
     "RobotsMali/stt-bm-quartznet5x5-V0",
@@ -28,75 +25,105 @@ ROBOTSMALI_MODELS = [
 # Cache pour stocker les pipelines ASR déjà chargés.
 asr_pipelines = {}
 def load_pipeline(model_name):
     """
     Charge le pipeline ASR (modèle + processeur) pour un modèle donné et le met en cache.
     """
     if model_name not in asr_pipelines:
         print(f"-> Tentative de chargement du modèle: {model_name}...")
         try:
-            # Notez que si vous voulez utiliser l'accélération GPU sur Colab (recommandé),
-            # vous pouvez utiliser 'device=0' après avoir sélectionné un GPU dans
-            # "Environnement d'exécution -> Modifier le type d'environnement d'exécution"
             asr_pipelines[model_name] = pipeline(
                 "automatic-speech-recognition",
                 model=model_name,
-                # device=0
             )
             print(f"-> Modèle {model_name} chargé avec succès.")
         except Exception as e:
             print(f"!!! Erreur de chargement pour {model_name}: {e}")
             raise RuntimeError(f"Impossible de charger le modèle {model_name}. Vérifiez sa configuration.")
     return asr_pipelines[model_name]
 # ----------------------------------------------------------------------
 # 2. FONCTION PRINCIPALE D'INFÉRENCE
 # ----------------------------------------------------------------------
 def transcribe_audio(model_name: str, audio_path: str) -> str:
     """
     Effectue la transcription ASR sur un fichier audio en utilisant le modèle sélectionné.
     """
     if audio_path is None:
         return "⚠️ Veuillez d'abord télécharger ou enregistrer un fichier audio."
     if not ROBOTSMALI_MODELS:
         return "Liste de modèles ASR indisponible."
     start_time = time.time()
     try:
         if model_name not in ROBOTSMALI_MODELS:
             return f"Modèle sélectionné ({model_name}) non reconnu."
         asr_pipe = load_pipeline(model_name)
         result = asr_pipe(audio_path)
         end_time = time.time()
         duration = end_time - start_time
         transcription_text = result.get("text", "Transcription non disponible.")
         model_short_name = model_name.split('/')[-1]
         output = f"**Modèle Utilisé :** `{model_short_name}`\n\n"
         output += f"***\n"
         output += f"**Temps d'inférence (hors chargement) :** {duration:.2f} secondes\n"
         output += f"**RÉSULTAT DE LA TRANSCRIPTION :**\n"
         output += f"**{transcription_text.strip()}**"
         return output
     except RuntimeError as e:
         return f"❌ Erreur critique : {str(e)}"
     except Exception as e:
         return f"❌ Erreur lors de la transcription avec {model_name}: {e}"
 # ----------------------------------------------------------------------
-# 3. INTERFACE GRADIO ET LANCEMENT (Adapté à Colab)
 # ----------------------------------------------------------------------
 model_dropdown = gr.Dropdown(
@@ -104,31 +131,26 @@ model_dropdown = gr.Dropdown(
     choices=ROBOTSMALI_MODELS,
     value=ROBOTSMALI_MODELS[0] if ROBOTSMALI_MODELS else None,
     interactive=True,
-    allow_custom_value=False
-)
 audio_input = gr.Audio(
     label="2. Télécharger ou Enregistrer l'Audio",
     type="filepath",
     sources=["microphone", "upload"],
-    format="mp3"
-)
 text_output = gr.Markdown(
-    label="3. Résultat de la Transcription ASR"
-)
 interface = gr.Interface(
     fn=transcribe_audio,
     inputs=[model_dropdown, audio_input],
     outputs=text_output,
     title="🤖 RobotsMali ASR Multi-Modèles (Test Colab)",
-    description="Sélectionnez un modèle ASR de RobotsMali, puis enregistrez ou téléchargez un fichier audio (MP3 recommandé) pour obtenir la transcription.",
-    allow_flagging="never"
-)
 # Lancement de l'Interface Gradio sur Colab
-# L'option 'share=True' est nécessaire pour générer un lien public temporaire
-# et afficher l'interface directement dans le notebook ou via un lien externe.
 print("Lancement de l'interface Gradio...")
 interface.launch(share=True)

 # -*- coding: utf-8 -*-
 """RobotsMali_ASR_Demo.ipynb
 Automatically generated by Colab.
 Original file is located at
     https://colab.research.google.com/drive/1fCpSvqwoSbpEBC62cZrQuqQGr4U1BNsh
 """
 import gradio as gr
 from transformers import pipeline
 import time
+import os
 # ----------------------------------------------------------------------
 # 1. CONFIGURATION DES MODÈLES
 # ----------------------------------------------------------------------
 # Liste des identifiants exacts des modèles RobotsMali
 ROBOTSMALI_MODELS = [
+    "RobotsMali/soloba-ctc-0.6b-v0",  # Le modèle qui posait problème
     "RobotsMali/soloni-114m-tdt-ctc-v1",
     "RobotsMali/soloni-114m-tdt-ctc-V0",
     "RobotsMali/stt-bm-quartznet5x5-V0",
 # Cache pour stocker les pipelines ASR déjà chargés.
 asr_pipelines = {}
 def load_pipeline(model_name):
     """
     Charge le pipeline ASR (modèle + processeur) pour un modèle donné et le met en cache.
     """
     if model_name not in asr_pipelines:
         print(f"-> Tentative de chargement du modèle: {model_name}...")
         try:
+            # Cette ligne charge le modèle directement depuis le Hub Hugging Face
             asr_pipelines[model_name] = pipeline(
                 "automatic-speech-recognition",
                 model=model_name,
+                # device=0  # Décommenter si un GPU est disponible et souhaité
             )
             print(f"-> Modèle {model_name} chargé avec succès.")
         except Exception as e:
+            # Meilleure gestion d'erreur : affiche la trace complète dans les logs du Space
             print(f"!!! Erreur de chargement pour {model_name}: {e}")
+            # Si vous avez besoin de la trace complète dans les logs du Space
+            # import traceback; traceback.print_exc()
             raise RuntimeError(f"Impossible de charger le modèle {model_name}. Vérifiez sa configuration.")
     return asr_pipelines[model_name]
 # ----------------------------------------------------------------------
 # 2. FONCTION PRINCIPALE D'INFÉRENCE
 # ----------------------------------------------------------------------
 def transcribe_audio(model_name: str, audio_path: str) -> str:
     """
     Effectue la transcription ASR sur un fichier audio en utilisant le modèle sélectionné.
     """
     if audio_path is None:
         return "⚠️ Veuillez d'abord télécharger ou enregistrer un fichier audio."
     if not ROBOTSMALI_MODELS:
         return "Liste de modèles ASR indisponible."
     start_time = time.time()
     try:
         if model_name not in ROBOTSMALI_MODELS:
             return f"Modèle sélectionné ({model_name}) non reconnu."
+        # Le modèle est chargé ou récupéré depuis le cache ici
         asr_pipe = load_pipeline(model_name)
+        # S'assure que le fichier audio existe avant de l'envoyer au pipeline
+        if not os.path.exists(audio_path):
+             return "❌ Erreur : Fichier audio introuvable ou chemin invalide."
         result = asr_pipe(audio_path)
         end_time = time.time()
         duration = end_time - start_time
         transcription_text = result.get("text", "Transcription non disponible.")
         model_short_name = model_name.split('/')[-1]
         output = f"**Modèle Utilisé :** `{model_short_name}`\n\n"
         output += f"***\n"
         output += f"**Temps d'inférence (hors chargement) :** {duration:.2f} secondes\n"
         output += f"**RÉSULTAT DE LA TRANSCRIPTION :**\n"
         output += f"**{transcription_text.strip()}**"
         return output
     except RuntimeError as e:
+        # Ceci capture l'erreur de chargement (si elle n'a pas été capturée au pré-chargement)
         return f"❌ Erreur critique : {str(e)}"
     except Exception as e:
         return f"❌ Erreur lors de la transcription avec {model_name}: {e}"
 # ----------------------------------------------------------------------
+# 2.5. PRÉ-CHARGEMENT DU MODÈLE PAR DÉFAUT (NOUVEAU)
+# ----------------------------------------------------------------------
+INITIAL_DESCRIPTION = "Sélectionnez un modèle ASR de RobotsMali, puis enregistrez ou téléchargez un fichier audio (MP3 recommandé) pour obtenir la transcription."
+if ROBOTSMALI_MODELS:
+    default_model = ROBOTSMALI_MODELS[0]
+    try:
+        # Tente de charger le modèle par défaut au démarrage du script
+        load_pipeline(default_model)
+        default_model_short_name = default_model.split('/')[-1]
+        INITIAL_DESCRIPTION = (
+            f"✅ Le modèle par défaut `{default_model_short_name}` a été préchargé avec succès. "
+            f"Téléchargez ou enregistrez votre audio pour transcrire."
+        )
+    except RuntimeError as e:
+        # Si le chargement échoue, informe l'utilisateur que le modèle par défaut est cassé
+        default_model_short_name = default_model.split('/')[-1]
+        INITIAL_DESCRIPTION = (
+            f"❌ ERREUR CRITIQUE AU DÉMARRAGE : Impossible de charger le modèle "
+            f"`{default_model_short_name}`. "
+            f"**Veuillez sélectionner un autre modèle dans la liste** (ex: le second). "
+            f"Détails de l'erreur : {str(e)}"
+        )
+    except Exception:
+        # Capture toute autre erreur non gérée par RuntimeError
+        INITIAL_DESCRIPTION = "❌ ERREUR CRITIQUE AU DÉMARRAGE : Problème inconnu lors du pré-chargement du modèle."
+# ----------------------------------------------------------------------
+# 3. INTERFACE GRADIO ET LANCEMENT
 # ----------------------------------------------------------------------
 model_dropdown = gr.Dropdown(
     choices=ROBOTSMALI_MODELS,
     value=ROBOTSMALI_MODELS[0] if ROBOTSMALI_MODELS else None,
     interactive=True,
+    allow_custom_value=False)
 audio_input = gr.Audio(
     label="2. Télécharger ou Enregistrer l'Audio",
     type="filepath",
     sources=["microphone", "upload"],
+    format="mp3")
 text_output = gr.Markdown(
+    label="3. Résultat de la Transcription ASR")
 interface = gr.Interface(
     fn=transcribe_audio,
     inputs=[model_dropdown, audio_input],
     outputs=text_output,
     title="🤖 RobotsMali ASR Multi-Modèles (Test Colab)",
+    # Utilise la description générée par la phase de pré-chargement
+    description=INITIAL_DESCRIPTION,
+    allow_flagging="never")
 # Lancement de l'Interface Gradio sur Colab
 print("Lancement de l'interface Gradio...")
 interface.launch(share=True)