ComPO

community

AI & ML interests

None defined yet.

Recent Activity

PeterLauLukCh authored a paper 18 days ago

Reward-free Alignment for Conflicting Objectives

PeterLauLukCh submitted a paper 20 days ago

Reward-free Alignment for Conflicting Objectives

PeterLauLukCh authored a paper 2 months ago

Exploration v.s. Exploitation: Rethinking RLVR through Clipping, Entropy, and Spurious Reward

View all activity

ComparisonPO 's models 18

ComparisonPO/Mistral-7B-Instruct-A0.21B-ComPO

7B • Updated Aug 4, 2025 • 2

ComparisonPO/Mistral-7B-Instruct-ComPO-3300pert-300iter-2

7B • Updated Jul 21, 2025

ComparisonPO/Mistral-7B-Instruct-ComPO-3300pert-300iter

7B • Updated Jul 13, 2025 • 1

ComparisonPO/Gemma-2-9b-it-SimPO-ComPO

9B • Updated Apr 10, 2025 • 3

ComparisonPO/Mistral-Instruct-7B-SimPO-ComPO

7B • Updated Apr 7, 2025 • 1

ComparisonPO/Llama-3-Instruct-8B-SimPO-ComPO

8B • Updated Apr 5, 2025 • 1

ComparisonPO/Llama-3-Base-8B-DPO-ComPO

8B • Updated Mar 26, 2025 • 1

ComparisonPO/Llama-3-Instruct-8B-DPO-ComPO

8B • Updated Mar 19, 2025 • 1

ComparisonPO/Llama-3-Base-8B-DPO_clean

8B • Updated Mar 17, 2025 • 1

ComparisonPO/Mistral-Base-7B-DPO

7B • Updated Mar 17, 2025 • 4 • 2

ComparisonPO/Llama-3-Base-8B-DPO

8B • Updated Mar 17, 2025 • 1

ComparisonPO/Llama-3-Instruct-8B-DPO_clean

8B • Updated Mar 17, 2025 • 2

ComparisonPO/Llama-3-Instruct-8B-DPO

8B • Updated Mar 17, 2025

ComparisonPO/Mistral-Base-7B-DPO_clean

7B • Updated Mar 17, 2025 • 6 • 2

ComparisonPO/Mistral-Instruct-7B-DPO

7B • Updated Mar 17, 2025 • 3

ComparisonPO/Mistral-Instruct-7B-DPO-ComPO

7B • Updated Mar 17, 2025 • 1 • 1

ComparisonPO/Mistral-Base-7B-DPO-ComPO

7B • Updated Mar 17, 2025 • 1

ComparisonPO/Mistral-Instruct-7B-DPO_clean

7B • Updated Mar 17, 2025 • 2