4 9 1

Yikun B

Yikunb

AI & ML interests

Reinforcement Learning

Recent Activity

upvoted a paper about 2 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

submitted a paper about 2 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

liked a model 10 days ago

chhao/Weak-Driven-Learning

View all activity

Organizations

None yet

upvoted a paper about 2 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published 14 days ago • 35

submitted a paper to Daily Papers about 2 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published 14 days ago • 35

liked a model 10 days ago

chhao/Weak-Driven-Learning

Text Generation • Updated 9 days ago • 54 • 3

commented a paper 13 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 14 days ago • 262 •

authored a paper 13 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 14 days ago • 262

submitted a paper to Daily Papers 13 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 14 days ago • 262

upvoted a paper 13 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 14 days ago • 262

authored a paper 21 days ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published 24 days ago • 13

upvoted a paper 21 days ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published 24 days ago • 13

submitted a paper to Daily Papers 21 days ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published 24 days ago • 13

upvoted 2 papers about 1 month ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 197

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154

upvoted a collection about 1 month ago

cool-papers

Collection

95 items • Updated 3 days ago • 8

submitted a paper to Daily Papers about 1 month ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154

authored 2 papers about 1 month ago

Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning

Paper • 2505.16270 • Published May 22, 2025 • 6

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154

commented 2 papers about 1 month ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154 •

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154 •

upvoted a paper 5 months ago

TaTToo: Tool-Grounded Thinking PRM for Test-Time Scaling in Tabular Reasoning

Paper • 2510.06217 • Published Oct 7, 2025 • 65

upvoted a paper 8 months ago

ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs

Paper • 2506.18896 • Published Jun 23, 2025 • 29

Yikun B

AI & ML interests

Recent Activity

Organizations

Yikunb's activity