Makrrr
/

Qwen3-1.7B-GSM8K-GRPO-verl

Reinforcement Learning

Model card Files Files and versions

Qwen3-1.7B-GSM8K-GRPO-verl

4.08 GB

1 contributor

History: 4 commits

Makrrr's picture

Update README.md

ce2bc1d verified 5 months ago