shaowenchen
/

llama-2-7b-langchain-chat-gguf

Text Generation

Model card Files Files and versions

shaowenchen commited on Sep 12, 2023

Commit

a172f59

·

1 Parent(s): 33b5f22

Update README.md

Files changed (1) hide show

README.md +8 -0

README.md CHANGED Viewed

@@ -41,6 +41,14 @@ tags:
 | llama-2-7b-langchain-chat.Q8_0.gguf   | Q8_0         | 6.7 GB |
 | llama-2-7b-langchain-chat.gguf        | full         | 13 GB  |
 ## Provided images
 | Name                                              | Quant method | Size    |

 | llama-2-7b-langchain-chat.Q8_0.gguf   | Q8_0         | 6.7 GB |
 | llama-2-7b-langchain-chat.gguf        | full         | 13 GB  |
+Usage:
+```
+docker run --rm -it -p 8000:8000 -v /path/to/models:/models -e MODEL=/models/gguf-model-name.gguf hubimage/llama-cpp-python:latest
+```
+and you can view http://localhost:8000/docs to see the swagger UI.
 ## Provided images
 | Name                                              | Quant method | Size    |