steerapi
/

Llama-2-7b-chat-hf-onnx-awq-w8-g128

Text Generation

Model card Files Files and versions

Llama-2-7b-chat-hf-onnx-awq-w8-g128 / onnx

13 GB

1 contributor

History: 2 commits

steerapi's picture

Upload folder using huggingface_hub

e4de35d over 2 years ago

decoder_model_merged_quantized.onnx

8.81 MB
xet

Upload folder using huggingface_hub over 2 years ago
decoder_model_merged_quantized.onnx_data

13 GB
xet

Upload folder using huggingface_hub over 2 years ago
quantize_config.json

992 Bytes

Upload folder using huggingface_hub over 2 years ago