alibidaran
/

GRPO_LLAMA3-instructive_reasoning1

text-generation-inference

Model card Files Files and versions

GRPO_LLAMA3-instructive_reasoning1

1.36 GB

1 contributor

History: 5 commits

alibidaran's picture

Update README.md

730f0f2 verified 25 days ago