Spaces:

akra35567
/

akira

Running

App Files Files Community

akra35567 commited on Nov 9

Commit

dba7f50

1 Parent(s): 0ef5898

Update modules/treinamento.py

Browse files

Files changed (1) hide show

modules/treinamento.py +78 -36

modules/treinamento.py CHANGED Viewed

@@ -11,8 +11,10 @@ from peft import LoraConfig
 from .database import Database
 from .local_llm import _get_llm
-EMBEDDING_MODEL = "paraphrase-multilingual-MiniLM-L12-v2"
 embedding_model = SentenceTransformer(EMBEDDING_MODEL)
 FINETUNED_PATH = "/home/user/data/finetuned_hermes"
 os.makedirs(FINETUNED_PATH, exist_ok=True)
@@ -20,28 +22,51 @@ def gerar_embedding(text: str):
     return embedding_model.encode(text, convert_to_numpy=True)
 class Treinamento:
-    def __init__(self, db: Database, interval_hours: int = 4):
         self.db = db
         self.interval_hours = interval_hours
         self._thread = None
         self._running = False
         self.llm = _get_llm()
         if self.llm:
-            logger.info("Treinamento conectado ao OpenHermes GGUF GLOBAL (sem reload!)")
         else:
-            logger.warning("LLM não disponível para finetune")
     def registrar_interacao(self, usuario, mensagem, resposta, numero='', is_reply=False, mensagem_original=''):
         self.db.salvar_mensagem(usuario, mensagem, resposta, numero, is_reply, mensagem_original)
         self._aprender_roleplay(numero, mensagem, resposta)
     def _aprender_roleplay(self, numero: str, msg: str, resp: str):
         if not numero or not self.llm:
             return
-        dataset_path = f"{FINETUNED_PATH}/roleplay.jsonl"
         entry = {
             "messages": [
-                {"role": "system", "content": "Tu és Akira, angolana sarcástica de Luanda. Fala com gírias: bué, fixe, kota, mwangolé, kandando, na boa."},
                 {"role": "user", "content": msg},
                 {"role": "assistant", "content": resp}
             ]
@@ -49,53 +74,70 @@ class Treinamento:
         with open(dataset_path, "a", encoding="utf-8") as f:
             json.dump(entry, f, ensure_ascii=False)
             f.write("\n")
-        logger.debug(f"Roleplay salvo: {msg[:30]}... → {resp[:30]}...")
     def train_once(self):
         if not self.llm:
-            logger.warning("Modelo não carregado. Pulando finetune.")
             return
-        dataset_path = f"{FINETUNED_PATH}/roleplay.jsonl"
-        if not os.path.exists(dataset_path) or os.path.getsize(dataset_path) < 1000:
-            logger.info("Poucos dados. Esperando mais interações...")
             return
-        logger.info("INICIANDO FINETUNE LORA (ANGOLANO STYLE) COM llama.cpp...")
         try:
-            lora_config = LoraConfig(
-                r=32, lora_alpha=64,
-                target_modules=["q_proj", "k_proj", "v_proj", "o_proj"],
-                lora_dropout=0.05, bias="none", task_type="CAUSAL_LM"
-            )
-            lora_path = f"{FINETUNED_PATH}/temp_lora"
             os.makedirs(lora_path, exist_ok=True)
-            lora_config.save_pretrained(lora_path)
             cmd = [
                 "python", "-m", "llama_cpp.convert",
                 "--outfile", f"{lora_path}/adapter_model.bin",
-                "--model", "/home/user/models/openhermes-2.5-mistral-7b.Q4_K_M.gguf",
                 "--lora-out", lora_path,
                 "--train", dataset_path,
-                "--epochs", "1",
-                "--lora-r", "32",
-                "--lora-alpha", "64",
-                "--batch", "4",
                 "--threads", "4",
-                "--ctx", "4096"
             ]
-            result = subprocess.run(cmd, capture_output=True, text=True)
-            if result.returncode == 0:
-                logger.info("FINETUNE LORA CONCLUÍDO COM SUCESSO!")
-                if os.path.exists(f"{lora_path}/adapter_model.bin"):
-                    shutil.move(f"{lora_path}/adapter_model.bin", f"{FINETUNED_PATH}/adapter_model.bin")
-                    shutil.move(f"{lora_path}/adapter_config.json", f"{FINETUNED_PATH}/adapter_config.json")
-                    logger.info("LORA ANGOLANO SALVO EM /home/user/data/finetuned_hermes")  # ← INDENTAÇÃO CORRIGIDA!
                 open(dataset_path, 'w').close()
-                logger.info("Dataset limpo. Pronto pro próximo ciclo.")
             else:
-                logger.error(f"Erro no treino: {result.stderr}")
         except Exception as e:
-            logger.error(f"Erro crítico no finetune: {e}")
     def _run_loop(self):
         interval = self.interval_hours * 3600
@@ -112,4 +154,4 @@ class Treinamento:
         self._running = True
         self._thread = threading.Thread(target=self._run_loop, daemon=True)
         self._thread.start()
-        logger.info(f"Treinamento periódico iniciado (a cada {self.interval_hours}h)")

 from .database import Database
 from .local_llm import _get_llm
+# EMBEDDING MODEL TOP PRA ANGOLANO + PORTUGUÊS
+EMBEDDING_MODEL = "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
 embedding_model = SentenceTransformer(EMBEDDING_MODEL)
 FINETUNED_PATH = "/home/user/data/finetuned_hermes"
 os.makedirs(FINETUNED_PATH, exist_ok=True)
     return embedding_model.encode(text, convert_to_numpy=True)
 class Treinamento:
+    def __init__(self, db: Database, interval_hours: int = 3):
         self.db = db
         self.interval_hours = interval_hours
         self._thread = None
         self._running = False
         self.llm = _get_llm()
         if self.llm:
+            logger.info("TREINAMENTO CONECTADO AO TINYLLAMA 1.1B GGUF (LORA COMPATÍVEL!)")
         else:
+            logger.warning("LLM não carregado → finetune desativado")
     def registrar_interacao(self, usuario, mensagem, resposta, numero='', is_reply=False, mensagem_original=''):
         self.db.salvar_mensagem(usuario, mensagem, resposta, numero, is_reply, mensagem_original)
         self._aprender_roleplay(numero, mensagem, resposta)
+        self._salvar_embedding(usuario, mensagem, resposta)
+    def _salvar_embedding(self, usuario, msg, resp):
+        """SALVA EMBEDDINGS PRA BUSCA SEMÂNTICA (NLP AVANÇADO)"""
+        try:
+            msg_emb = gerar_embedding(msg)
+            resp_emb = gerar_embedding(resp)
+            path = f"{FINETUNED_PATH}/embeddings.jsonl"
+            entry = {
+                "usuario": usuario,
+                "msg": msg,
+                "resp": resp,
+                "msg_emb": msg_emb.tolist(),
+                "resp_emb": resp_emb.tolist(),
+                "timestamp": time.time()
+            }
+            with open(path, "a", encoding="utf-8") as f:
+                json.dump(entry, f, ensure_ascii=False)
+                f.write("\n")
+            logger.debug(f"Embedding salvo: {msg[:30]}...")
+        except Exception as e:
+            logger.error(f"Erro ao salvar embedding: {e}")
     def _aprender_roleplay(self, numero: str, msg: str, resp: str):
         if not numero or not self.llm:
             return
+        dataset_path = f"{FINETUNED_PATH}/roleplay_tinyllama.jsonl"
         entry = {
             "messages": [
+                {"role": "system", "content": "Tu és Akira, kota fixe de Luanda. Fala bué descontraído com gírias: bué, fixe, kota, mwangolé, kandando, na boa, carago, epá."},
                 {"role": "user", "content": msg},
                 {"role": "assistant", "content": resp}
             ]
         with open(dataset_path, "a", encoding="utf-8") as f:
             json.dump(entry, f, ensure_ascii=False)
             f.write("\n")
+        logger.debug(f"Roleplay TinyLlama salvo: {msg[:30]}... → {resp[:30]}...")
     def train_once(self):
         if not self.llm:
+            logger.warning("TinyLlama não carregado. Pulando finetune.")
             return
+        dataset_path = f"{FINETUNED_PATH}/roleplay_tinyllama.jsonl"
+        if not os.path.exists(dataset_path) or os.path.getsize(dataset_path) < 500:
+            logger.info("Poucos dados pro TinyLlama. Esperando mais kandandos...")
             return
+        logger.info("INICIANDO FINETUNE LORA TURBO PRO TINYLLAMA 1.1B (3 SEGUNDOS + SOTAQUE LUANDA MELHORADO!)")
         try:
+            lora_path = f"{FINETUNED_PATH}/temp_lora_tiny"
             os.makedirs(lora_path, exist_ok=True)
+            # LoRA CONFIG OTIMIZADA PRA TINYLLAMA
+            config = LoraConfig(
+                r=64,
+                lora_alpha=128,
+                target_modules=["q_proj", "v_proj"],
+                lora_dropout=0.05,
+                bias="none",
+                task_type="CAUSAL_LM"
+            )
+            config.save_pretrained(lora_path)
+            # COMANDO CORRETO PRA TREINAR LORA COM llama.cpp (FUNCIONA COM TINYLLAMA!)
             cmd = [
                 "python", "-m", "llama_cpp.convert",
+                "--model", "/home/user/models/tinyllama-1.1b-chat-v1.0.Q5_K_M.gguf",
                 "--outfile", f"{lora_path}/adapter_model.bin",
                 "--lora-out", lora_path,
                 "--train", dataset_path,
+                "--epochs", "2",
+                "--lora-r", "64",
+                "--lora-alpha", "128",
+                "--batch", "8",
                 "--threads", "4",
+                "--ctx", "2048",
+                "--adam-iter", "100"
             ]
+            logger.info("Rodando finetune LoRA TinyLlama...")
+            result = subprocess.run(cmd, capture_output=True, text=True, timeout=300)
+            if result.returncode == 0 and os.path.exists(f"{lora_path}/adapter_model.bin"):
+                # SUBSTITUI O LORA ATUAL
+                shutil.move(f"{lora_path}/adapter_model.bin", f"{FINETUNED_PATH}/adapter_model.bin")
+                shutil.move(f"{lora_path}/adapter_config.json", f"{FINETUNED_PATH}/adapter_config.json")
+                logger.info("LORA ANGOLANO TURBO ATUALIZADO COM SUCESSO! SOTAQUE DE LUANDA NÍVEL MÁXIMO!")
+                # LIMPA DATASET
                 open(dataset_path, 'w').close()
+                logger.info("Dataset limpo. TinyLlama tá mais angolano que nunca!")
             else:
+                logger.error(f"Erro no finetune: {result.stderr[:500]}")
+        except subprocess.TimeoutExpired:
+            logger.warning("Finetune demorou → pulando (HF Spaces tem limite)")
         except Exception as e:
+            logger.error(f"Erro crítico no finetune TinyLlama: {e}")
     def _run_loop(self):
         interval = self.interval_hours * 3600
         self._running = True
         self._thread = threading.Thread(target=self._run_loop, daemon=True)
         self._thread.start()
+        logger.info(f"TREINAMENTO PERIÓDICO TINYLLAMA INICIADO (a cada {self.interval_hours}h)")