Spaces:

akra35567
/

akira

Running

App Files Files Community

akra35567 commited on Nov 8

Commit

95affee

1 Parent(s): 5e7b481

Update Dockerfile

Browse files

Files changed (1) hide show

Dockerfile +40 -12

Dockerfile CHANGED Viewed

@@ -1,43 +1,71 @@
-# Dockerfile – BAIXA HERMES 7B SEM CARREGAR NA RAM (OOM FIX)
 FROM python:3.11-slim
 ENV DEBIAN_FRONTEND=noninteractive \
     PYTHONUNBUFFERED=1 \
-    PYTHONDONTWRITEBYTECODE=1
 RUN apt-get update && \
-    apt-get install -y --no-install-recommends curl wget git ca-certificates && \
     rm -rf /var/lib/apt/lists/*
 WORKDIR /app
 COPY requirements.txt .
 COPY modules/ modules/
 COPY main.py .
-# Instala dependências
 RUN pip install --upgrade pip && \
     pip install --no-cache-dir torch==2.4.1 --index-url https://download.pytorch.org/whl/cpu && \
     pip install --no-cache-dir -r requirements.txt && \
-    pip install --no-cache-dir huggingface_hub sentencepiece
-# BAIXA HERMES 7B SÓ OS ARQUIVOS (SEM CARREGAR NA RAM!)
 RUN python - <<'EOF'
 from huggingface_hub import snapshot_download
 import os
-print('BAIXANDO HERMES 7B (SÓ ARQUIVOS, SEM RAM)...')
-model_name = "NousResearch/Hermes-2-Pro-Mistral-7B"
 snapshot_download(
-    repo_id=model_name,
     local_dir="/app/models/hermes-7b",
     local_dir_use_symlinks=False,
     resume_download=True,
-    allow_patterns=["*.json", "*.bin", "*.model", "tokenizer*", "generation_config.json"]
 )
-print('HERMES 7B BAIXADO (SÓ DISCO)!')
 EOF
-RUN mkdir -p /app/data/finetuned_hermes
 EXPOSE 7860
 CMD ["gunicorn", "--workers", "1", "--threads", "2", "--timeout", "300", "--bind", "0.0.0.0:7860", "main:app"]

+# Dockerfile – FORÇA .safetensors + VERIFICAÇÃO RÍGIDA
 FROM python:3.11-slim
 ENV DEBIAN_FRONTEND=noninteractive \
     PYTHONUNBUFFERED=1 \
+    PYTHONDONTWRITEBYTECODE=1 \
+    HF_HUB_ENABLE_HF_TRANSFER=1 \
+    PIP_NO_CACHE_DIR=1
+# Instala dependências
 RUN apt-get update && \
+    apt-get install -y --no-install-recommends \
+        curl wget git ca-certificates gcc g++ && \
     rm -rf /var/lib/apt/lists/*
 WORKDIR /app
+# Copia arquivos
 COPY requirements.txt .
 COPY modules/ modules/
 COPY main.py .
+# Instala PyTorch CPU + HF + extras
 RUN pip install --upgrade pip && \
     pip install --no-cache-dir torch==2.4.1 --index-url https://download.pytorch.org/whl/cpu && \
     pip install --no-cache-dir -r requirements.txt && \
+    pip install --no-cache-dir \
+        huggingface_hub[hf_transfer] \
+        sentencepiece \
+        sentence-transformers \
+        peft \
+        datasets \
+        accelerate
+# BAIXA HERMES 7B COM .safetensors OBRIGATÓRIO
 RUN python - <<'EOF'
 from huggingface_hub import snapshot_download
 import os
+import sys
+print("BAIXANDO HERMES 7B (FORÇANDO .safetensors)...")
 snapshot_download(
+    repo_id="NousResearch/Hermes-2-Pro-Mistral-7B",
     local_dir="/app/models/hermes-7b",
     local_dir_use_symlinks=False,
     resume_download=True,
+    allow_patterns=[
+        "config.json",
+        "generation_config.json",
+        "tokenizer*",
+        "model-*-of-*.safetensors"  # FORÇA .safetensors
+    ],
+    ignore_patterns=["*.bin", "*.msgpack"]  # IGNORA .bin
 )
+# VERIFICA 4 SHARDS .safetensors
+shards = [f for f in os.listdir("/app/models/hermes-7b") if f.endswith(".safetensors")]
+if len(shards) != 4:
+    print(f"ERRO: {len(shards)} SHARDS .safetensors ENCONTRADOS! ESPERADO: 4")
+    print("SHARDS:", shards)
+    sys.exit(1)
+print(f"SUCESSO: {len(shards)} SHARDS .safetensors BAIXADOS!")
 EOF
+# Cria pastas persistentes
+RUN mkdir -p /app/data/finetuned_hermes /tmp/offload
 EXPOSE 7860
 CMD ["gunicorn", "--workers", "1", "--threads", "2", "--timeout", "300", "--bind", "0.0.0.0:7860", "main:app"]