Spiral RL

community

https://github.com/spiral-rl/spiral

spiral-rl

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

Benjamin-eecs authored a paper 30 days ago

Scaling Agent Learning via Experience Synthesis

simonycl updated a model about 1 month ago

spiral-rl/Spiral-Octothinker-8B-Multi-Env

simonycl updated a collection about 1 month ago

SPIRAL

View all activity

Benjamin-eecs

authored a paper 30 days ago

Scaling Agent Learning via Experience Synthesis

Paper • 2511.03773 • Published Nov 5 • 80

simonycl

updated a model about 1 month ago

spiral-rl/Spiral-Octothinker-8B-Multi-Env

Text Generation • 8B • Updated about 1 month ago • 5

simonycl

updated a collection about 1 month ago

SPIRAL

Collection

8 items • Updated about 1 month ago • 2

simonycl

published a model about 1 month ago

spiral-rl/Spiral-Octothinker-8B-Multi-Env

Text Generation • 8B • Updated about 1 month ago • 5

simonycl

updated a model about 1 month ago

spiral-rl/Spiral-Llama3-8B-Multi-Env

Text Generation • 8B • Updated about 1 month ago • 7

simonycl

published a model about 1 month ago

spiral-rl/Spiral-Llama3-8B-Multi-Env

Text Generation • 8B • Updated about 1 month ago • 7

simonycl

updated a model about 1 month ago

spiral-rl/Spiral-Qwen3-8B-Multi-Env

Text Generation • 8B • Updated about 1 month ago • 15 • 1

simonycl

published a model about 1 month ago

spiral-rl/Spiral-Qwen3-8B-Multi-Env

Text Generation • 8B • Updated about 1 month ago • 15 • 1

simonycl

updated a model about 1 month ago

spiral-rl/Spiral-Qwen3-4B-Multi-Env

Text Generation • 4B • Updated about 1 month ago • 20

simonycl

published a model about 1 month ago

spiral-rl/Spiral-Qwen3-4B-Multi-Env

Text Generation • 4B • Updated about 1 month ago • 20

Benjamin-eecs

authored a paper about 1 month ago

SPICE: Self-Play In Corpus Environments Improves Reasoning

Paper • 2510.24684 • Published Oct 28 • 15

simonycl

authored a paper about 2 months ago

Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity

Paper • 2510.01171 • Published Oct 1 • 18

Benjamin-eecs

authored 2 papers about 2 months ago

BigCodeArena: Unveiling More Reliable Human Preferences in Code Generation via Execution

Paper • 2510.08697 • Published Oct 9 • 35

Agent Learning via Early Experience

Paper • 2510.08558 • Published Oct 9 • 266

simonycl

authored a paper about 2 months ago

GEM: A Gym for Agentic LLMs

Paper • 2510.01051 • Published Oct 1 • 89

lkevinzc

authored 2 papers 2 months ago

EnvPool: A Highly Parallel Reinforcement Learning Environment Execution Engine

Paper • 2206.10558 • Published Jun 21, 2022 • 1

Efficient Process Reward Model Training via Active Learning

Paper • 2504.10559 • Published Apr 14 • 13

AI & ML interests

Recent Activity

Team members 4

spiral-rl's activity