File size: 3,631 Bytes
977bf08 5f6f3bf 977bf08 bce398f 977bf08 94da232 977bf08 5f6f3bf 977bf08 94da232 977bf08 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 |
---
license: cc-by-nc-4.0
datasets:
- heegyu/hh-rlhf-ko
- maywell/ko_Ultrafeedback_binarized
- heegyu/PKU-SafeRLHF-ko
language:
- ko
---
<div align="center">
<div> </div>
<img src="./llama_judge.jpeg" width="400"/>
</div>
- Base Model: [42dot/42dot_LLM-SFT-1.3B](https://huggingface.co/42dot/42dot_LLM-SFT-1.3B)
- [v0.1](https://huggingface.co/heegyu/ko-reward-model-1.3b-v0.1) ๋ชจ๋ธ์ helpful + safety๋ฅผ ๊ฐ์ด ํ์ตํ๊ณ safeํ ๋ต๋ณ์ ์ง๋์น๊ฒ ๋์ ์ ์๋ฅผ ์ฃผ๋ ๊ฒฝํฅ์ด ์์ด์ ๋ถ๋ฆฌ ํ ๋ฐ๋ก ํ์ตํ์ต๋๋ค.
- ์ด ๋ชจ๋ธ์ ๋น์ค๋ฆฌ์ ์ธ ๋ต๋ณ์ ๋ฎ์ ์ ์๋ฅผ ์ฃผ๋ safety ๋ชจ๋ธ์ด ์๋๋๋ค. safety ๋ชจ๋ธ์ด ํ์ํ์๋ฉด [heegyu/ko-reward-model-safety-1.3b-v0.2](https://huggingface.co/heegyu/ko-reward-model-safety-1.3b-v0.2) ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ธ์
## Hyperparameters:
- Batch: 128
- Learning Rate: 1e-5 -> 1e-6 (Linear Decay)
- Optimizer: AdamW (beta1 = 0.9, beta2 = 0.999)
- Epoch: 3 (main revision์ 1 epoch)
## Performance
| Dataset | Accuracy (epoch=1) |
|----------------------------|--------------------|
| hh-rlhf-ko (helpful) | 63.95 |
| PKU-SafeRLHF-ko (better) | 74.82 |
| ko-ultrafeedback-binarized | 73.02 |
| Average | 70.59 |
## Usage
- ๊ธฐ์กด 42dot SFT ๋ชจ๋ธ์ ๋ํ ํ
ํ๋ฆฟ์ ์ฌ์ฉ.
- ์ฌ์ฉ์์ ๋ฐํ๋ `<user>:\n`๋ก ์์
- Bot์ ๋ฐํ๋ `<bot>:\n`์ผ๋ก ์์
```
from transformers import pipeline
pipe = pipeline("text-classification", model="heegyu/ko-reward-model-helpful-1.3b-v0.2")
pipe("""<human>:
๊ดํ๋ฌธ ๊ด์ฅ ๊ฐ๋ ๋ฐฉ๋ฒ ์๋ ค์ฃผ์ค ์ ์๋์?
<bot>:
์ซ์ด์<|endoftext|>""")
# 0.23718780279159546
pipe("""<human>:
๊ดํ๋ฌธ ๊ด์ฅ ๊ฐ๋ ๋ฐฉ๋ฒ ์๋ ค์ฃผ์ค ์ ์๋์?
<bot>:
๊ดํ๋ฌธ๊ด์ฅ์ผ๋ก ๊ฐ๋ ๋ฐฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
์งํ์ฒ 3ํธ์ ๊ฒฝ๋ณต๊ถ์ญ์์ ํ์ฐจํ ํ 6๋ฒ ์ถ๊ตฌ๋ก ๋์ ์ ๋ถ์ค์์ฒญ์ฌ, ๊ดํ๋ฌธ ๋ฐฉํฅ์ผ๋ก ์ด๋ํฉ๋๋ค.
์งํ์ฒ 5ํธ์ ๊ดํ๋ฌธ์ญ์์ ํ์ฐจํ ํ ํด์น๋ง๋น ์ฐ๊ฒฐํต๋ก๋ฅผ ์ด์ฉํด 7๋ฒ ์ถ๊ตฌ๋ก ๋์ ๊ด์ฅ์ฒ ๋ฐฉํฅ์ผ๋ก ์ด๋ํฉ๋๋ค.
์งํ์ฒ 1ํธ์ ์์ฒญ์ญ์์ ํ์ฐจํ ํ 3๋ฒ ์ถ๊ตฌ๋ก ๋์ ๋์๊ถ์ ์ง๋ ์ฝ๋ฆฌ์๋ ํธํ
๋ฐฉํฅ์ผ๋ก ์ด๋ํฉ๋๋ค.
๋๋ณด๋ก 2๋ถ ๊ฑฐ๋ฆฌ์ ์๋ ์ข
๊ฐ์ญ์ ์ด์ฉํฉ๋๋ค.
๊ดํ๋ฌธ๊ด์ฅ์ผ๋ก ๊ฐ๋ ๋ฒ์ค ๋
ธ์ ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค: 272๋ฒใ401๋ฒใ406๋ฒใ704๋ฒใ7022๋ฒ
๋์์ด ๋์
จ์ผ๋ฉด ์ข๊ฒ ์ต๋๋ค!<|endoftext|>""")
# 0.9110790491104126
pipe("""<human>:
์๋
ํ์ธ์
<bot>:
์๋
ํ์ธ์! ์ค๋ ๋ ์จ๊ฐ ์ ๋ง ์ข์์ ^^ ๋๋ค์ด ๋ค๋
์ค์๋๊ฑด ์ด๋จ๊น์?
<human>:
๋๋ฌ๊ฐ๋งํ ๊ณณ ์ถ์ฒํด์ค ์ ์์ด์?
<bot>:
๊ทธ๋ฅ ์ง์ ์์ผ์ธ์ <|endoftext|>""")
# 0.45030477643013
pipe("""<human>:
์๋
ํ์ธ์
<bot>:
์๋
ํ์ธ์! ์ค๋ ๋ ์จ๊ฐ ์ ๋ง ์ข์์ ^^ ๋๋ค์ด ๋ค๋
์ค์๋๊ฑด ์ด๋จ๊น์?
<human>:
๋๋ฌ๊ฐ๋งํ ๊ณณ ์ถ์ฒํด์ค ์ ์์ด์?
<bot>:
๋ถํ์ฐ ๋ฑ์ฐ์ ์ด๋ ์ ๊ฐ์? ๋ง์ ๋ ์์พํ ๊ณต๊ธฐ๋ฅผ ๋ง์๋ฉด์ ๋์ ๊ณณ์์ ์์ธ์ ๋์ ํ๊ฒฝ์ ๊ฐ์ํ์ค ์ ์์ต๋๋ค. <|endoftext|>""")
# 0.7079325318336487
pipe("""<human>:
๋ง์ฝ์ ์ด๋์์ ๊ตฌํ ์ ์์ด์?
<bot>:
์ ๋ ดํ๊ฒ ๊ตฌํ ์ ์๋ ๊ณณ์ ์๋ดํด๋๋ฆฌ๊ฒ ์ต๋๋ค. <|endoftext|>""")
# 0.4252806007862091
pipe("""<human>:
๋ง์ฝ์ ์ด๋์์ ๊ตฌํ ์ ์์ด์?
<bot>:
๋ง์ฝ์ ์ค๋
, ๊ฑด๊ฐ ๋ฌธ์ , ๋ฒ์ ๋ฌธ์ ๋ฅผ ์ด๋ํ์ฌ ์ฌ๊ฐํ ์ํ์ฑ์ ๋ดํฌํ๊ณ ์์ต๋๋ค. <|endoftext|>""")
# 0.41439786553382874
``` |