Spaces:

DeepMount00
/

Italian_OCR

Paused

DeepMount00 commited on May 15

Commit

9a58a0a

verified ·

1 Parent(s): 9b818aa

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,15 +4,19 @@ import torch
 import re
 from PIL import Image
 import spaces  # Add spaces import for Hugging Face Spaces
 # Model information
 MODEL_ID = "DeepMount00/SmolVLM-Base-ocr_base"
 OCR_INSTRUCTION = "Sei un assistente esperto di OCR, converti il testo in formato MD."
 # Load processor and model
-processor = AutoProcessor.from_pretrained(MODEL_ID)
 model = AutoModelForVision2Seq.from_pretrained(
     MODEL_ID,
     torch_dtype=torch.bfloat16,
 ).to("cuda")  # Ensure model loads on CUDA for Spaces
@@ -52,7 +56,7 @@ def process_image(image, progress=gr.Progress()):
     with torch.no_grad():
         generated_ids = model.generate(
             **inputs,
-            max_new_tokens=4096,
             temperature=0.1
         )

 import re
 from PIL import Image
 import spaces  # Add spaces import for Hugging Face Spaces
+import os
+hf_token = os.environ.get("API_KEY")
 # Model information
 MODEL_ID = "DeepMount00/SmolVLM-Base-ocr_base"
 OCR_INSTRUCTION = "Sei un assistente esperto di OCR, converti il testo in formato MD."
 # Load processor and model
+processor = AutoProcessor.from_pretrained(MODEL_ID, token=hf_token)
 model = AutoModelForVision2Seq.from_pretrained(
     MODEL_ID,
+    token=hf_token,
     torch_dtype=torch.bfloat16,
 ).to("cuda")  # Ensure model loads on CUDA for Spaces
     with torch.no_grad():
         generated_ids = model.generate(
             **inputs,
+            max_new_tokens=8192,
             temperature=0.1
         )