ubermenchh
/

SmolLM2-DPO-ultrafeedback-binarized-preferences

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

SmolLM2-DPO-ultrafeedback-binarized-preferences / merges.txt

ubermenchh's picture

End of training

c0db0bf verified 10 months ago

history contribute delete

466 kB

File too large to display, you can check the raw version instead.