manu02
/

Nanbeige4.1-3B-bnb-4bit-nf4-dq

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions

Nanbeige4.1-3B-bnb-4bit-nf4-dq

3.31 GB

1 contributor

History: 4 commits

manu02's picture

Upload 4-bit quantized version of Nanbeige/Nanbeige4.1-3B with 58.8% memory reduction

e598854 verified 9 days ago

.gitattributes
1.57 kB

Upload 4-bit quantized version of Nanbeige/Nanbeige4.1-3B with 58.8% memory reduction 9 days ago
README.md
1.07 kB

Upload 4-bit quantized version of Nanbeige/Nanbeige4.1-3B with 58.8% memory reduction 9 days ago
chat_template.jinja
5.66 kB

Upload 4-bit quantized version of Nanbeige/Nanbeige4.1-3B with 58.8% memory reduction 9 days ago
config.json
1.32 kB

Upload 4-bit quantized version of Nanbeige/Nanbeige4.1-3B with 58.8% memory reduction 9 days ago
generation_config.json
153 Bytes

Upload 4-bit quantized version of Nanbeige/Nanbeige4.1-3B with 58.8% memory reduction 9 days ago
model.safetensors
3.29 GB
xet

Upload 4-bit quantized version of Nanbeige/Nanbeige4.1-3B with 58.8% memory reduction 9 days ago
tokenizer.json
18.5 MB
xet

Upload 4-bit quantized version of Nanbeige/Nanbeige4.1-3B with 58.8% memory reduction 9 days ago
tokenizer_config.json
464 Bytes

Upload 4-bit quantized version of Nanbeige/Nanbeige4.1-3B with 58.8% memory reduction 9 days ago