inference-optimization
/

granite-4.0-h-tiny-quantized.w8a8

granitemoehybrid

8-bit precision

compressed-tensors

Model card Files Files and versions

granite-4.0-h-tiny-quantized.w8a8

7.65 GB

1 contributor

History: 8 commits

krishnateja95's picture

Update config.json

507095e verified 4 days ago