alibidaran
/

GRPO_LLAMA3-instructive_reasoning1

text-generation-inference

Model card Files Files and versions

GRPO_LLAMA3-instructive_reasoning1

1.34 GB

1 contributor

History: 3 commits

alibidaran's picture

Upload model trained with Unsloth

0613edc verified 5 months ago