sravanthib
/

with_accelarate_output_Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions

with_accelarate_output_Qwen2-0.5B-GRPO-test

21 MB

1 contributor

History: 19 commits

sravanthib's picture

End of training

9c36aa5 verified 9 months ago