Reward Bench - a allenai Collection

allenai 's Collections

MolmoAct2 Eval Rollouts

Molmo2-ER Datasets

MolmoAct2-BimanualYAM Dataset

MolmoAct2 Datasets

MolmoAct2 Finetuned Models

MolmoAct2 Models

Branch-Adapt-Route

MolmoPoint-Data

MolmoBot-Models

Open Coding Agents Specialization

Open Coding Agents

Olmo 3 Pre-training

Olmo 3 Post-training

MolmoAct Data Mixture

OLMoE (January 2025)

Tulu 3 Datasets

OLMoE (November 2024)

Tulu V2.5 Suite

AI2 Safety Toolkit

Zebra Logic Bench

OLMo 2 Preview Post-trained Models

Reward Bench

updated Dec 23, 2025

Datasets, spaces, and models for the reward model benchmark!