Makrrr
/

Qwen3-1.7B-GSM8K-GRPO-verl

Reinforcement Learning

Model card Files Files and versions

Qwen3-1.7B-GSM8K-GRPO-verl / vocab.json

Makrrr's picture

Initial model upload from verl training

ba8acf8 verified 6 months ago

history contribute delete

2.78 MB

File too large to display, you can check the raw version instead.