Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

174

Full-text search

Active filters: modelopt

lukealonso/MiniMax-M2.5-NVFP4

130B • Updated 5 days ago • 13.5k • 29

nvidia/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated 3 days ago • 179 • 8

vincentzed-hf/Qwen3.5-397B-A17B-NVFP4

Image-Text-to-Text • Updated 5 days ago • 16k • 8

lukealonso/MiniMax-M2.5-REAP-139B-A10B-NVFP4

78B • Updated 1 day ago • 314 • 8

lukealonso/GLM-5-NVFP4

425B • Updated 5 days ago • 6.18k • 5

nvidia/Qwen3-Next-80B-A3B-Thinking-NVFP4

Text Generation • Updated 13 days ago • 72.5k • 48

tiiuae/Falcon-H1R-7B-FP8

Text Generation • 8B • Updated 11 days ago • 111 • 4

nvidia/Kimi-K2.5-NVFP4

Text Generation • Updated 17 days ago • 50.4k • 48

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 13 days ago • 26.7k • 27

vincentzed-hf/Qwen3-Coder-Next-NVFP4

Text Generation • Updated 6 days ago • 5.22k • 5

nvidia/Llama-4-Scout-17B-16E-Instruct-NVFP4

56B • Updated Dec 12, 2025 • 12.7k • 21

nvidia/Llama-3.1-8B-Instruct-NVFP4

5B • Updated Sep 15, 2025 • 107k • 7

nvidia/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Sep 9, 2025 • 23.4k • 14

nvidia/Qwen3-14B-FP8

Text Generation • 15B • Updated Sep 9, 2025 • 3.36k • 4

nvidia/Kimi-K2-Thinking-NVFP4

Text Generation • Updated 12 days ago • 127k • 27

Salyut1/GLM-4.7-NVFP4

Text Generation • 177B • Updated Dec 23, 2025 • 3.79k • 16

nvidia/Qwen3-235B-A22B-Thinking-2507-NVFP4

Text Generation • Updated 22 days ago • 626 • 4

nvidia/Qwen3-235B-A22B-Instruct-2507-NVFP4

Text Generation • 120B • Updated 22 days ago • 1.9k • 3

nvidia/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated 17 days ago • 411 • 2

BenChaliah/Gemma3-27B-it-NVFP4

15B • Updated 18 days ago • 10 • 3

baseten-admin/Kimi-2.5-text-nvfp4-v6-mlp-only

Updated 18 days ago • 1.62k • 1

txn545/Qwen3-Coder-Next-NVFP4

Updated 7 days ago • 120 • 1

nvidia/Llama-4-Maverick-17B-128E-Instruct-FP8

402B • Updated Jul 29, 2025 • 607 • 12

nvidia/Llama-4-Scout-17B-16E-Instruct-FP8

109B • Updated Dec 12, 2025 • 43k • 11

ishan24/test_modelopt_quant

Updated Apr 25, 2025 • 4

nvidia/Llama-4-Maverick-17B-128E-Eagle3

Updated Sep 3, 2025 • 10 • 9

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 54.9k • 23

jiangchengchengNLP/L3.3-MS-Nevoria-70b-FP8

Text Generation • 71B • Updated Nov 29, 2025 • 6

NVFP4/Qwen3-30B-A3B-Instruct-2507-FP4

Text Generation • 16B • Updated Aug 1, 2025 • 1.16k • 11

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5, 2025 • 21.4k • 7