inference-optimization
/

Qwen3-32B-FP8-dynamic-QKV-Cache-FP8-Per-Tensor

compressed-tensors

Model card Files Files and versions

Qwen3-32B-FP8-dynamic-QKV-Cache-FP8-Per-Tensor / model-00006-of-00007.safetensors

Commit History

Upload folder using huggingface_hub

6fafde2
verified

krishnateja95 commited on 12 days ago