inference-optimization
/

Qwen3-32B-FP8-dynamic-QKV-Cache-FP8-Per-Tensor

compressed-tensors

Model card Files Files and versions

Qwen3-32B-FP8-dynamic-QKV-Cache-FP8-Per-Tensor

1.55 kB

1 contributor

History: 1 commit

krishnateja95's picture

initial commit

6e36a3e verified 7 days ago