kangdawei
/

MMR-DR_GRPO-lambda-0.6

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

MMR-DR_GRPO-lambda-0.6 / tokenizer.json

Commit History

Training in progress, step 100

5f94503
verified

kangdawei commited on Oct 25