s3nh
/

TinyLLama-4x1.1B-MoE

Text Generation

text-generation-inference

Model card Files Files and versions

s3nh commited on Jan 10, 2024

Commit

e860448

·

1 Parent(s): 7f8e61e

Update README.md

Files changed (1) hide show

README.md +26 -2

README.md CHANGED Viewed

@@ -10,13 +10,37 @@ tags:
 ---
-This model was created by tremendous work of mergekit developers. I decided to merge tinyLlama models to
 create mixture of experts.
 Config used as below:
 ```
 """base_model: TinyLlama/TinyLlama-1.1B-Chat-v1.0
 experts:

 ---
+Example usage:
+```python
+from transformers import AutoModelForCausalLM
+from transformers import AutoTokenizer
+tokenizer = AutoTokenizer.from_pretrained("s3nh/TinyLLama-1.1B-MoE")
+tokenizer = AutoTokenizer.from_pretrained("s3nh/TinyLLama-1.1B-MoE")
+input_text =  """
+###Input: You are a pirate. tell me a story about wrecked ship.
+###Response:
+""")
+input_ids = tokenizer.encode(input_text, return_tensors='pt').to(device)
+output = model.generate(inputs=input_ids,
+                        max_length=max_length,
+                        do_sample=True,
+                        top_k=10,
+                        temperature=0.7,
+                        pad_token_id=tokenizer.eos_token_id,
+                        attention_mask=input_ids.new_ones(input_ids.shape))
+tokenizer.decode(output[0], skip_special_tokens=True)
+```
+This model was possible to create by tremendous work of mergekit developers. I decided to merge tinyLlama models to
 create mixture of experts.
 Config used as below:
 ```
 """base_model: TinyLlama/TinyLlama-1.1B-Chat-v1.0
 experts: