CofeAI
/

Tele-FLM

@@ -34,7 +34,7 @@ import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
 tokenizer = AutoTokenizer.from_pretrained('CofeAI/Tele-FLM', trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained('CofeAI/Tele-FLM', torch_dtype=torch.bfloat16, low_cpu_mem_usage=True, device_map="auto", trust_remote_code=True)
-inputs = tokenizer('北京市是中国的首都', return_tensors='pt').to(model.device)
 generated = model.generate(**inputs, max_new_tokens=128, repetition_penalty=1.03)
 print(tokenizer.decode(generated.cpu()[0], skip_special_tokens=True))
 ```

 from transformers import AutoTokenizer, AutoModelForCausalLM
 tokenizer = AutoTokenizer.from_pretrained('CofeAI/Tele-FLM', trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained('CofeAI/Tele-FLM', torch_dtype=torch.bfloat16, low_cpu_mem_usage=True, device_map="auto", trust_remote_code=True)
+inputs = tokenizer('Beijing is the capital of China.', return_tensors='pt').to(model.device)
 generated = model.generate(**inputs, max_new_tokens=128, repetition_penalty=1.03)
 print(tokenizer.decode(generated.cpu()[0], skip_special_tokens=True))
 ```