Huanxin Sheng's picture

Huanxin Sheng

HuanxinSheng

·

https://brucesheng1202.github.io/index.html

AI & ML interests

None yet

Recent Activity

upvoted a collection 1 day ago

Nemotron-Post-Training-v3

commentedon a paper 6 days ago

Rethinking On-Policy Distillation of Large Language Models: Phenomenology, Mechanism, and Recipe

commentedon a paper 6 days ago

Lightning OPD: Efficient Post-Training for Large Reasoning Models with Offline On-Policy Distillation

View all activity

Organizations

commented 4 papers 6 days ago

Rethinking On-Policy Distillation of Large Language Models: Phenomenology, Mechanism, and Recipe

Paper • 2604.13016 • Published 15 days ago • 87 •

Lightning OPD: Efficient Post-Training for Large Reasoning Models with Offline On-Policy Distillation

Paper • 2604.13010 • Published 15 days ago • 12 •

Rethinking On-Policy Distillation of Large Language Models: Phenomenology, Mechanism, and Recipe

Paper • 2604.13016 • Published 15 days ago • 87 •

Lightning OPD: Efficient Post-Training for Large Reasoning Models with Offline On-Policy Distillation

Paper • 2604.13010 • Published 15 days ago • 12 •