kangdawei
/

MMR-DR_GRPO-lambda-0.7

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

MMR-DR_GRPO-lambda-0.7 / README.md

Commit History

End of training

53a0b14
verified

kangdawei commited on Oct 27, 2025

Model save

41444cd
verified

kangdawei commited on Oct 27, 2025