kangdawei
/

MMR-DR_GRPO-lambda-0.7

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

MMR-DR_GRPO-lambda-0.7 / training_args.bin

Commit History

Training in progress, step 450

74fe1a9
verified

kangdawei commited on Oct 26, 2025

Training in progress, step 100

9992e46
verified

kangdawei commited on Oct 25, 2025