RL Models - a Jackmin108 Collection

Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
- Website
- Community
- Solutions
Log In
Sign Up

Jackmin108 's Collections

RL Models

updated May 30, 2025

RL Models

deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

Text Generation • 8B • Updated Feb 24, 2025 • 615k • • 833
Jackmin108/qwen-7b-rl-step-1

Text Generation • 8B • Updated May 30, 2025
Jackmin108/qwen-7b-rl-step-2

Text Generation • 8B • Updated May 30, 2025 • 4
Jackmin108/qwen-7b-rl-step-3

Text Generation • 8B • Updated May 30, 2025 • 2
Jackmin108/qwen-7b-rl-step-4

Text Generation • 8B • Updated May 30, 2025 • 3
Jackmin108/qwen-7b-rl-step-8

Text Generation • 8B • Updated May 30, 2025 • 2
Jackmin108/qwen-7b-rl-step-16

Text Generation • 8B • Updated May 30, 2025 • 5
Jackmin108/qwen-7b-rl-step-31

Text Generation • 8B • Updated May 30, 2025 • 3
Jackmin108/qwen-7b-rl-step-32

Text Generation • 8B • Updated May 30, 2025 • 3

Collection guide
Browse collections

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs