Spaces:

ReasoningTrap
/

README

Running

yjyjyj98 commited on May 22

Commit

589ef88

verified ·

1 Parent(s): 48163d7

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -20,5 +20,4 @@ pinned: false
 > Current RL-tuned Reasoning LLMs excel at *producing* answers, but often ignore explicit user constraints.
 > **ReasoningTrap** surfaces these failure modes with carefully crafted, *conditioned* problems.
 * **Modified from Famous MATH Reasoning Benchmark** – AIME & MATH500 long-form proofs.
-* **Plug-and-play** – evaluate any 🤗 Transformers, vLLM or OpenAI-style chat model in two lines.

 > Current RL-tuned Reasoning LLMs excel at *producing* answers, but often ignore explicit user constraints.
 > **ReasoningTrap** surfaces these failure modes with carefully crafted, *conditioned* problems.
 * **Modified from Famous MATH Reasoning Benchmark** – AIME & MATH500 long-form proofs.