Spaces:

VaibhavHD
/

Deepseeklora

Sleeping

VaibhavHD commited on Nov 2

Commit

5352ede

verified ·

1 Parent(s): 14aa92c

Update inference.py

Files changed (1) hide show

inference.py CHANGED Viewed

@@ -1,15 +1,19 @@
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
 BASE_MODEL = "deepseek-ai/deepseek-coder-1.3b-base"
 LORA_REPO  = "VaibhavHD/deepseek-lora-monthly"
 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL, trust_remote_code=True)
 base = AutoModelForCausalLM.from_pretrained(BASE_MODEL, trust_remote_code=True)
 model = PeftModel.from_pretrained(base, LORA_REPO)
-def generate_response(prompt:str)->str:
     inputs = tokenizer(prompt, return_tensors="pt")
     out = model.generate(**inputs, max_new_tokens=200)
     return tokenizer.decode(out[0], skip_special_tokens=True)

 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
+import torch
+import transformers.training_args
+# ✅ Fix: allow this class for safe loading in PyTorch 2.6+
+torch.serialization.add_safe_globals([transformers.training_args.TrainingArguments])
 BASE_MODEL = "deepseek-ai/deepseek-coder-1.3b-base"
 LORA_REPO  = "VaibhavHD/deepseek-lora-monthly"
 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL, trust_remote_code=True)
 base = AutoModelForCausalLM.from_pretrained(BASE_MODEL, trust_remote_code=True)
 model = PeftModel.from_pretrained(base, LORA_REPO)
+def generate_response(prompt: str) -> str:
     inputs = tokenizer(prompt, return_tensors="pt")
     out = model.generate(**inputs, max_new_tokens=200)
     return tokenizer.decode(out[0], skip_special_tokens=True)