Spaces:

red-rectangle
/

black-box

Runtime error

Joel Lundgren commited on Sep 17, 2025

Commit

c1ec8e5

1 Parent(s): dc90ed9

cache fix

Files changed (1) hide show

app.py CHANGED Viewed

@@ -71,7 +71,11 @@ def get_llm(model_name):
         "gemma3:1b": "google/gemma-3-1b-it"
     }
     tokenizer = AutoTokenizer.from_pretrained(original_model_map[model_name])
-    model = ORTModelForCausalLM.from_pretrained(hf_model_name)
     llm_cache[model_name] = (model, tokenizer)
     return model, tokenizer

         "gemma3:1b": "google/gemma-3-1b-it"
     }
     tokenizer = AutoTokenizer.from_pretrained(original_model_map[model_name])
+    model = ORTModelForCausalLM.from_pretrained(
+        hf_model_name,
+        file_name="model_quantized.onnx",
+        use_cache=False
+    )
     llm_cache[model_name] = (model, tokenizer)
     return model, tokenizer