Metin
/

LLaMA-3-8B-Math-Majority-Vote-GRPO

Text Generation

text-generation-inference

test-time-reinforcement-learning

Model card Files Files and versions

LLaMA-3-8B-Math-Majority-Vote-GRPO

16.1 GB

2 contributors

History: 11 commits

Metin's picture

nielsr's picture

nielsr HF Staff

Improve model card: add pipeline tag, library name, language, license, paper, and code links (#1)

c031abc verified 5 months ago