Mashiro's picture

4

Mashiro

AlexMashiro

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Breaking the Exploration Bottleneck: Rubric-Scaffolded Reinforcement Learning for General LLM Reasoning

upvoted a paper 26 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

upvoted a paper about 1 month ago

Self-Rewarding Rubric-Based Reinforcement Learning for Open-Ended Reasoning

View all activity

Organizations

None yet

upvoted a paper 2 days ago

Breaking the Exploration Bottleneck: Rubric-Scaffolded Reinforcement Learning for General LLM Reasoning

Paper • 2508.16949 • Published Aug 23 • 23

upvoted a paper 26 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published Nov 24 • 60

upvoted a paper about 1 month ago

Self-Rewarding Rubric-Based Reinforcement Learning for Open-Ended Reasoning

Paper • 2509.25534 • Published Sep 19 • 2

upvoted a paper about 2 months ago

Chasing the Tail: Effective Rubric-based Reward Modeling for Large Language Model Post-Training

Paper • 2509.21500 • Published Sep 25 • 18