hannahbillo
/

dpo-llama3-8b-sample-rules

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

dpo-llama3-8b-sample-rules / runs

75.3 kB

1 contributor

History: 9 commits

hannahbillo's picture

Training in progress, step 112

b0f0513 verified over 1 year ago