Spaces:

akra35567
/

akira

Running

App Files Files Community

akra35567 commited on Nov 9

Commit

e9a4858

1 Parent(s): 9354e45

Update modules/api.py

Browse files

Files changed (1) hide show

modules/api.py +14 -7

modules/api.py CHANGED Viewed

@@ -52,7 +52,7 @@ class LLMManager:
         self.config = config_instance
         self.mistral_client: Optional[Mistral] = None
         self.gemini_model: Optional[genai.GenerativeModel] = None
-        self.hermes_llm = self._import_hermes()  # ← CORRIGIDO AQUI!
         self._setup_providers()
         # PRIORIDADE: HERMES LOCAL → MISTRAL → GEMINI
@@ -71,7 +71,7 @@ class LLMManager:
         try:
             if HermesLLM.is_available():
                 logger.info("Hermes 7B local carregado com sucesso! (INSTÂNCIA PRONTA)")
-                return HermesLLM  # ← SEM PARÊNTESES! É O OBJETO!
             else:
                 logger.warning("HermesLLM existe mas não está disponível")
                 return None
@@ -121,18 +121,25 @@ class LLMManager:
         messages.append({"role": "user", "content": user_prompt})
         for provider in self.providers:
-            # 1. HERMES LOCAL
             if provider == 'hermes' and self.hermes_llm and self.hermes_llm.is_available():
                 try:
-                    logger.info(f"[HERMES] Gerando com max_tokens={self.config.MAX_TOKENS}, temp={self.config.TOP_P}")
                     text = self.hermes_llm.generate(
                         user_prompt,
-                        max_tokens=self.config.MAX_TOKENS,
-                        temperature=self.config.TOP_P
                     )
                     if text and text.strip():
                         logger.info("Hermes 7B local respondeu com sucesso")
                         return text.strip()
                 except Exception as e:
                     logger.warning(f"Hermes local falhou: {e}")
@@ -158,7 +165,7 @@ class LLMManager:
                     gemini_hist = []
                     for msg in messages[1:]:
                         role = "user" if msg["role"] == "user" else "model"
-                        gemini_hist.append({"role": role, "parts": [{"text": msg["content"]}]})
                     resp = self.gemini_model.generate_content(
                         gemini_hist,
                         generation_config=genai.GenerationConfig(

         self.config = config_instance
         self.mistral_client: Optional[Mistral] = None
         self.gemini_model: Optional[genai.GenerativeModel] = None
+        self.hermes_llm = self._import_hermes()
         self._setup_providers()
         # PRIORIDADE: HERMES LOCAL → MISTRAL → GEMINI
         try:
             if HermesLLM.is_available():
                 logger.info("Hermes 7B local carregado com sucesso! (INSTÂNCIA PRONTA)")
+                return HermesLLM
             else:
                 logger.warning("HermesLLM existe mas não está disponível")
                 return None
         messages.append({"role": "user", "content": user_prompt})
         for provider in self.providers:
+            # 1. HERMES LOCAL (PRIORIDADE MÁXIMA)
             if provider == 'hermes' and self.hermes_llm and self.hermes_llm.is_available():
                 try:
+                    logger.info(f"[HERMES] Gerando com max_tokens={self.config.MAX_TOKENS}")
+                    # llama.cpp NÃO aceita 'temperature' → só max_tokens
                     text = self.hermes_llm.generate(
                         user_prompt,
+                        max_tokens=self.config.MAX_TOKENS
                     )
                     if text and text.strip():
                         logger.info("Hermes 7B local respondeu com sucesso")
                         return text.strip()
+                except TypeError as e:
+                    if "temperature" in str(e):
+                        logger.info("Tentando sem temperature...")
+                        text = self.hermes_llm.generate(user_prompt, max_tokens=self.config.MAX_TOKENS)
+                        if text:
+                            logger.info("Hermes respondeu sem temperature")
+                            return text.strip()
                 except Exception as e:
                     logger.warning(f"Hermes local falhou: {e}")
                     gemini_hist = []
                     for msg in messages[1:]:
                         role = "user" if msg["role"] == "user" else "model"
+                        gemini_hist.append({"role": role, "parts": [{"text": msg["content"}]})
                     resp = self.gemini_model.generate_content(
                         gemini_hist,
                         generation_config=genai.GenerationConfig(