RRH - a maius Collection

maius 's Collections

RRH

Open Character Training

Liars!

RRH

updated 22 days ago

https://www.lesswrong.com/posts/HLJoJYi52mxgomujc/realistic-reward-hacking-induces-different-and-deeper-1