Spaces:

ngxson
/

Qwen2.5-Coder-14B-GGUF

Paused

ngxson HF Staff commited on Nov 12, 2024

Commit

d6a2959

verified ·

1 Parent(s): f212354

LLAMA_ARG_N_GPU_LAYERS

Files changed (1) hide show

Dockerfile CHANGED Viewed

@@ -1,5 +1,6 @@
 FROM ghcr.io/ggerganov/llama.cpp:server-cuda
 ENV LLAMA_ARG_CTX_SIZE=10000
 ENV LLAMA_ARG_FLASH_ATTN=1
 ENV LLAMA_ARG_HF_REPO=bartowski/Qwen2.5-Coder-14B-GGUF

 FROM ghcr.io/ggerganov/llama.cpp:server-cuda
+ENV LLAMA_ARG_N_GPU_LAYERS=9999
 ENV LLAMA_ARG_CTX_SIZE=10000
 ENV LLAMA_ARG_FLASH_ATTN=1
 ENV LLAMA_ARG_HF_REPO=bartowski/Qwen2.5-Coder-14B-GGUF