AIcell
/

Qwen2.5-1.5B-Instruct-GRPO-Math220k-thinking

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-Instruct-GRPO-Math220k-thinking

3.1 GB

1 contributor

History: 29 commits

AIcell's picture

Training in progress, step 4200

ef75d89 verified 3 months ago