ShadeCloak's picture

4 4

ShadeCloak

ShadeCloak

·

AI & ML interests

None yet

Recent Activity

updated a model 5 days ago

ShadeCloak/RM-58

updated a model 5 days ago

ShadeCloak/RM-29

published a model 5 days ago

ShadeCloak/RM-58

View all activity

Organizations

upvoted a paper 10 days ago

UniCorn: Towards Self-Improving Unified Multimodal Models through Self-Generated Supervision

Paper • 2601.03193 • Published 10 days ago • 44

upvoted a paper 5 months ago

Sample More to Think Less: Group Filtered Policy Optimization for Concise Reasoning

Paper • 2508.09726 • Published Aug 13, 2025 • 15

upvoted a paper 6 months ago

Agentic Reinforced Policy Optimization

Paper • 2507.19849 • Published Jul 26, 2025 • 158

upvoted a paper 11 months ago

Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning

Paper • 2502.14768 • Published Feb 20, 2025 • 47