Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

59

Full-text search

Active filters: reward_model

nvidia/Qwen3-Nemotron-14B-BRRM

Text Generation • Updated Dec 18, 2025 • 251 • 11

kp-forks/reward-model-deberta-v3-large-v2

Updated Feb 1, 2023 • 1

aliangdw/rewind-base-mw

0.1B • Updated Oct 28, 2025 • 8

aliangdw/rewind-base-mw-oxe

0.1B • Updated Oct 29, 2025 • 33

aliangdw/rewind-base-mw-oxe-reweight

0.1B • Updated Oct 29, 2025 • 14

aliangdw/rewind-base-mw-oxe-success

0.1B • Updated Oct 30, 2025 • 12

mradermacher/Qwen3-Nemotron-8B-BRRM-GGUF

8B • Updated Oct 30, 2025 • 308

mradermacher/Qwen3-Nemotron-8B-BRRM-i1-GGUF

8B • Updated Dec 10, 2025 • 706

aliangdw/rewind-base-oxe-mw-eval-jaco

0.1B • Updated Oct 30, 2025 • 10

mradermacher/Qwen3-Nemotron-14B-BRRM-GGUF

15B • Updated Oct 31, 2025 • 1.64k • 1

mradermacher/Qwen3-Nemotron-14B-BRRM-i1-GGUF

15B • Updated Dec 5, 2025 • 1.07k • 2

seangogo/Qwen2.5-1.5B_reward_model_v2

Feature Extraction • 2B • Updated Nov 7, 2025

seangogo/Qwen2.5-1.5B_reward_model_v2_normalized

Feature Extraction • 2B • Updated Nov 8, 2025

rewardfm/rewind_scale_preference_model

0.1B • Updated Dec 17, 2025 • 1

xander2432/djpo-reward-model

Text Classification • Updated Jan 5

rewardfm/libero_testset_prog_pref_4frames_fixdata

4B • Updated 23 days ago • 7

rewardfm/libero_testset_prog_4frames_fixdata

4B • Updated 23 days ago • 17

rewardfm/libero_testset_prog_pref_fail_4frames_fixdata

4B • Updated 23 days ago • 6

rewardfm/libero_90_prog_pref_4frames_fixdata

4B • Updated 23 days ago • 29

aliangdw/qwen4b_pref_prog_succ_8_frames_all

4B • Updated 22 days ago • 17

rewardfm/rewind-scale-rfm1M-32layers-8frame-20260118-180522

0.2B • Updated 21 days ago • 246

aliangdw/qwen4b_pref_prog_succ_8_frames_all_part2

4B • Updated 20 days ago • 15

aliangdw/libero_ablation_prog_pref_with_fail_lora_ft_4frames

5B • Updated 19 days ago • 6

aliangdw/libero_ablation_prog_pref_lora_ft_4frames

5B • Updated 19 days ago • 3

aliangdw/libero_ablation_prog_only_lora_ft_4frames

5B • Updated 19 days ago • 4

rewardfm/rewind-scale-libero-8layers-4frame-20260121-150005

0.1B • Updated 19 days ago • 36

aliangdw/rfm_qwen4b_pref_prog_succ_8frames_all_discrete_10bins_part2

4B • Updated 15 days ago • 22

aliangdw/rewind_rfm-1m-id_continuous_scaled

0.5B • Updated 13 days ago • 5

mihirgrao/trace-model

Image-to-Text • 4B • Updated 6 days ago • 119