inference-optimization
/

Llama-3.1-8B-Instruct-FP8-dynamic-QKV-Cache-FP8-Per-Head

compressed-tensors

Model card Files Files and versions

Llama-3.1-8B-Instruct-FP8-dynamic-QKV-Cache-FP8-Per-Head / README.md

Commit History

initial commit

c310671
verified

krishnateja95 commited on 6 days ago