Spaces:

akra35567
/

akira

Running

App Files Files Community

akra35567 commited on Nov 8

Commit

5ab2f61

1 Parent(s): 59f3a55

Update modules/api.py

Browse files

Files changed (1) hide show

modules/api.py +55 -20

modules/api.py CHANGED Viewed

@@ -10,10 +10,12 @@ import datetime
 from typing import Dict, Optional, Any, List
 from flask import Flask, Blueprint, request, jsonify
 from loguru import logger
 # LLM PROVIDERS
 import google.generativeai as genai
 from mistralai import Mistral
-from .local_llm import HermesLLM  # ← HERMES 7B LOCAL
 # LOCAL MODULES
 from .contexto import Contexto
 from .database import Database
@@ -21,45 +23,65 @@ from .treinamento import Treinamento
 from .exemplos_naturais import ExemplosNaturais
 import modules.config as config
 # --- CACHE SIMPLES COM TTL ---
 class SimpleTTLCache:
     def __init__(self, ttl_seconds: int = 300):
         self.ttl = ttl_seconds
         self._store = {}
     def __contains__(self, key):
-        if key not in self._store: return False
         _, expires = self._store[key]
-        if time.time() > expires: del self._store[key]; return False
         return True
     def __setitem__(self, key, value):
         self._store[key] = (value, time.time() + self.ttl)
     def __getitem__(self, key):
-        if key not in self: raise KeyError(key)
         return self._store[key][0]
 # --- GERENCIADOR DE LLMs ---
 class LLMManager:
     def __init__(self, config_instance):
         self.config = config_instance
         self.mistral_client: Optional[Mistral] = None
         self.gemini_model: Optional[genai.GenerativeModel] = None
-        self.hermes_llm = self._import_hermes()  # ← HERMES
         self._setup_providers()
         # PRIORIDADE: HERMES LOCAL → MISTRAL → GEMINI
         self.providers = []
         if self.hermes_llm and self.hermes_llm.is_available():
             self.providers.append('hermes')
         if self.mistral_client:
             self.providers.append('mistral')
         if self.gemini_model:
             self.providers.append('gemini')
         logger.info(f"Provedores ativos (ordem): {self.providers or 'NENHUM'}")
     def _import_hermes(self):
         try:
-            return HermesLLM()  # ← HERMES 7B LOCAL
         except Exception as e:
-            logger.warning(f"Hermes 7B local não carregado: {e}")
             return None
     def _setup_providers(self):
@@ -103,11 +125,16 @@ class LLMManager:
         for provider in self.providers:
             # 1. HERMES LOCAL (PRIORIDADE MÁXIMA)
-            if provider == 'hermes' and self.hermes_llm:
                 try:
-                    text = self.hermes_llm.generate(user_prompt, max_tokens=self.config.MAX_TOKENS, temperature=self.config.TOP_P)
-                    if text:
-                        logger.info("Hermes 7B local respondeu")
                         return text.strip()
                 except Exception as e:
                     logger.warning(f"Hermes local falhou: {e}")
@@ -149,7 +176,11 @@ class LLMManager:
                 except Exception as e:
                     logger.warning(f"Gemini falhou: {e}")
-        return getattr(self.config, 'FALLBACK_RESPONSE', 'Desculpa, puto, to off hoje.')
 # --- API PRINCIPAL ---
 class AkiraAPI:
@@ -177,11 +208,11 @@ class AkiraAPI:
             try:
                 data = request.get_json(force=True, silent=True) or {}
                 usuario = data.get('usuario', 'anonimo')
-                numero = data.get('numero', '')  # ← JID COMPLETO (2449...@s.whatsapp.net)
                 mensagem = data.get('mensagem', '').strip()
-                mensagem_citada = data.get('mensagem_citada', '').strip()  # ← DO index.js
                 is_reply = bool(mensagem_citada)
-                mensagem_original = mensagem_citada  # ← pra compatibilidade
                 if not mensagem and not mensagem_citada:
                     return jsonify({'error': 'mensagem obrigatória'}), 400
@@ -190,6 +221,7 @@ class AkiraAPI:
                 contexto = self._get_user_context(usuario)
                 analise = contexto.analisar_intencao_e_normalizar(mensagem, contexto.obter_historico())
                 if usuario.lower() in ['isaac', 'isaac quarenta']:
                     analise['usar_nome'] = False
@@ -202,6 +234,7 @@ class AkiraAPI:
                 )
                 resposta = self._generate_response(prompt, contexto.obter_historico_para_llm(), is_privileged)
                 contexto.atualizar_contexto(mensagem, resposta)
                 # REGISTRA NO TREINAMENTO
@@ -210,7 +243,7 @@ class AkiraAPI:
                     trainer = Treinamento(db)
                     trainer.registrar_interacao(usuario, mensagem, resposta, numero, is_reply, mensagem_original)
                 except Exception as e:
-                    self.logger.warning(f"Registro falhou: {e}")
                 response_data = {'resposta': resposta}
                 try:
@@ -254,8 +287,10 @@ class AkiraAPI:
             f"- Número do bot: 244952786417.\n"
         )
         system_part = strict_override + f"\n{self.config.SYSTEM_PROMPT}\n{self.config.PERSONA}\n"
-        if is_privileged: system_part += "- Tom formal com Isaac.\n"
-        if is_blocking: system_part += "\n# BLOQUEIO: Xingue (vai pra merda, etc).\n"
         usar_nome = analise.get('usar_nome', False)
         parts = [
@@ -263,7 +298,6 @@ class AkiraAPI:
             f"### Contexto ###\n{historico_texto}\n\n",
         ]
-        # REPLY INTELIGENTE: INCLUI MENSAGEM CITADA
         if is_reply and mensagem_citada:
             parts.append(f"### MENSAGEM CITADA (Akira disse): ###\n{mensagem_citada}\n\n")
             parts.append(f"### USUÁRIO RESPONDEU A ESSA MENSAGEM: ###\n{mensagem or '(sem texto, só reply)'}\n\n")
@@ -283,7 +317,8 @@ class AkiraAPI:
             return getattr(self.config, 'FALLBACK_RESPONSE', 'Desculpa, estou off.')
     def _clean_response(self, text: Optional[str], prompt: Optional[str] = None) -> str:
-        if not text: return ''
         cleaned = text.strip()
         for prefix in ['akira:', 'Resposta:', 'resposta:', '### Resposta:']:
             if cleaned.lower().startswith(prefix.lower()):

 from typing import Dict, Optional, Any, List
 from flask import Flask, Blueprint, request, jsonify
 from loguru import logger
 # LLM PROVIDERS
 import google.generativeai as genai
 from mistralai import Mistral
+from .local_llm import HermesLLM  # ← HERMES 7B LOCAL (com generate(max_tokens, temp))
 # LOCAL MODULES
 from .contexto import Contexto
 from .database import Database
 from .exemplos_naturais import ExemplosNaturais
 import modules.config as config
 # --- CACHE SIMPLES COM TTL ---
 class SimpleTTLCache:
     def __init__(self, ttl_seconds: int = 300):
         self.ttl = ttl_seconds
         self._store = {}
     def __contains__(self, key):
+        if key not in self._store:
+            return False
         _, expires = self._store[key]
+        if time.time() > expires:
+            del self._store[key]
+            return False
         return True
     def __setitem__(self, key, value):
         self._store[key] = (value, time.time() + self.ttl)
     def __getitem__(self, key):
+        if key not in self:
+            raise KeyError(key)
         return self._store[key][0]
 # --- GERENCIADOR DE LLMs ---
 class LLMManager:
     def __init__(self, config_instance):
         self.config = config_instance
         self.mistral_client: Optional[Mistral] = None
         self.gemini_model: Optional[genai.GenerativeModel] = None
+        self.hermes_llm = self._import_hermes()
         self._setup_providers()
         # PRIORIDADE: HERMES LOCAL → MISTRAL → GEMINI
         self.providers = []
         if self.hermes_llm and self.hermes_llm.is_available():
             self.providers.append('hermes')
+            logger.info("HERMES 7B LOCAL ATIVO → PRIORIDADE MÁXIMA")
         if self.mistral_client:
             self.providers.append('mistral')
         if self.gemini_model:
             self.providers.append('gemini')
         logger.info(f"Provedores ativos (ordem): {self.providers or 'NENHUM'}")
     def _import_hermes(self):
+        """Tenta carregar Hermes 7B local"""
         try:
+            hermes = HermesLLM()
+            if hermes.is_available():
+                logger.info("Hermes 7B local carregado com sucesso!")
+            else:
+                logger.warning("Hermes 7B local carregado, mas não disponível (shards faltando?)")
+            return hermes
         except Exception as e:
+            logger.error(f"Falha ao instanciar HermesLLM: {e}")
+            import traceback
+            logger.error(traceback.format_exc())
             return None
     def _setup_providers(self):
         for provider in self.providers:
             # 1. HERMES LOCAL (PRIORIDADE MÁXIMA)
+            if provider == 'hermes' and self.hermes_llm and self.hermes_llm.is_available():
                 try:
+                    logger.info(f"[HERMES] Gerando com max_tokens={self.config.MAX_TOKENS}, temp={self.config.TOP_P}")
+                    text = self.hermes_llm.generate(
+                        user_prompt,
+                        max_tokens=self.config.MAX_TOKENS,
+                        temperature=self.config.TOP_P
+                    )
+                    if text and text.strip():
+                        logger.info("Hermes 7B local respondeu com sucesso")
                         return text.strip()
                 except Exception as e:
                     logger.warning(f"Hermes local falhou: {e}")
                 except Exception as e:
                     logger.warning(f"Gemini falhou: {e}")
+        # Fallback
+        fallback = getattr(self.config, 'FALLBACK_RESPONSE', 'Desculpa, puto, tô off hoje.')
+        logger.warning(f"TODOS LLMs FALHARAM → Usando fallback: {fallback}")
+        return fallback
 # --- API PRINCIPAL ---
 class AkiraAPI:
             try:
                 data = request.get_json(force=True, silent=True) or {}
                 usuario = data.get('usuario', 'anonimo')
+                numero = data.get('numero', '')
                 mensagem = data.get('mensagem', '').strip()
+                mensagem_citada = data.get('mensagem_citada', '').strip()
                 is_reply = bool(mensagem_citada)
+                mensagem_original = mensagem_citada
                 if not mensagem and not mensagem_citada:
                     return jsonify({'error': 'mensagem obrigatória'}), 400
                 contexto = self._get_user_context(usuario)
                 analise = contexto.analisar_intencao_e_normalizar(mensagem, contexto.obter_historico())
                 if usuario.lower() in ['isaac', 'isaac quarenta']:
                     analise['usar_nome'] = False
                 )
                 resposta = self._generate_response(prompt, contexto.obter_historico_para_llm(), is_privileged)
                 contexto.atualizar_contexto(mensagem, resposta)
                 # REGISTRA NO TREINAMENTO
                     trainer = Treinamento(db)
                     trainer.registrar_interacao(usuario, mensagem, resposta, numero, is_reply, mensagem_original)
                 except Exception as e:
+                    self.logger.warning(f"Registro de interação falhou: {e}")
                 response_data = {'resposta': resposta}
                 try:
             f"- Número do bot: 244952786417.\n"
         )
         system_part = strict_override + f"\n{self.config.SYSTEM_PROMPT}\n{self.config.PERSONA}\n"
+        if is_privileged:
+            system_part += "- Tom formal com Isaac.\n"
+        if is_blocking:
+            system_part += "\n# BLOQUEIO: Xingue (vai pra merda, etc).\n"
         usar_nome = analise.get('usar_nome', False)
         parts = [
             f"### Contexto ###\n{historico_texto}\n\n",
         ]
         if is_reply and mensagem_citada:
             parts.append(f"### MENSAGEM CITADA (Akira disse): ###\n{mensagem_citada}\n\n")
             parts.append(f"### USUÁRIO RESPONDEU A ESSA MENSAGEM: ###\n{mensagem or '(sem texto, só reply)'}\n\n")
             return getattr(self.config, 'FALLBACK_RESPONSE', 'Desculpa, estou off.')
     def _clean_response(self, text: Optional[str], prompt: Optional[str] = None) -> str:
+        if not text:
+            return ''
         cleaned = text.strip()
         for prefix in ['akira:', 'Resposta:', 'resposta:', '### Resposta:']:
             if cleaned.lower().startswith(prefix.lower()):