Xiangxin Zhou

zhouxiangxin

https://zhouxiangxin1998.github.io/

AI & ML interests

None yet

Recent Activity

authored a paper 3 days ago

Rethinking the Trust Region in LLM Reinforcement Learning

upvoted a paper 3 days ago

Rethinking the Trust Region in LLM Reinforcement Learning

liked a model 2 months ago

GSAI-ML/LLaDA-8B-Base

View all activity

Organizations

Collections 2

Papers 6

models 21

datasets 25

zhouxiangxin/data_to_zichen

Viewer • Updated Oct 30, 2025 • 1 • 14

zhouxiangxin/TACO_subset

Viewer • Updated Sep 28, 2025 • 4.24k • 6

zhouxiangxin/apps

Viewer • Updated Sep 28, 2025 • 5k • 6

zhouxiangxin/numina_all_subsets_formatted

Viewer • Updated Sep 28, 2025 • 39k • 4

zhouxiangxin/Variational-Posterior-4B-Acc-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 19 • 1

zhouxiangxin/Variational-Posterior-4B-GML-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 4

zhouxiangxin/Variational-Posterior-8B-Acc-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 8

zhouxiangxin/Variational-Posterior-8B-GML-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 11

zhouxiangxin/Variational-Posterior-32B-Acc-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 6

zhouxiangxin/Variational-Posterior-32B-GML-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 15

View 25 datasets

Xiangxin Zhou

AI & ML interests

Recent Activity

Organizations

Collections 2

zhouxiangxin/Variational-Reasoning-32B-Acc

zhouxiangxin/Variational-Reasoning-32B-GML

zhouxiangxin/Variational-Reasoning-8B-Acc

zhouxiangxin/Variational-Reasoning-8B-GML

zhouxiangxin/Qwen3-4B-Base-VeriFree

zhouxiangxin/Qwen3-8B-Base-VeriFree

zhouxiangxin/Variational-Reasoning-32B-Acc

zhouxiangxin/Variational-Reasoning-32B-GML

zhouxiangxin/Variational-Reasoning-8B-Acc

zhouxiangxin/Variational-Reasoning-8B-GML

zhouxiangxin/Qwen3-4B-Base-VeriFree

zhouxiangxin/Qwen3-8B-Base-VeriFree

Papers 6

models 21

zhouxiangxin/Variational-Posterior-PA-7B

zhouxiangxin/Variational-Posterior-PB-7B

zhouxiangxin/Variational-Posterior-PA-32B

zhouxiangxin/Variational-Posterior-PB-4B

zhouxiangxin/Variational-Posterior-PB-8B

zhouxiangxin/Initial-Reasoning-32B

zhouxiangxin/Initial-Reasoning-7B

zhouxiangxin/Variational-Reasoning-32B-Acc

zhouxiangxin/Initial-Reasoning-4B

zhouxiangxin/Variational-Reasoning-PA-7B-Acc

datasets 25

zhouxiangxin/data_to_zichen

zhouxiangxin/TACO_subset

zhouxiangxin/apps

zhouxiangxin/numina_all_subsets_formatted

zhouxiangxin/Variational-Posterior-4B-Acc-mix

zhouxiangxin/Variational-Posterior-4B-GML-mix

zhouxiangxin/Variational-Posterior-8B-Acc-mix

zhouxiangxin/Variational-Posterior-8B-GML-mix

zhouxiangxin/Variational-Posterior-32B-Acc-mix

zhouxiangxin/Variational-Posterior-32B-GML-mix

Xiangxin Zhou

AI & ML interests

Recent Activity

Organizations

Collections 2

Papers 6

models 21 Sort: Recently updated

datasets 25 Sort: Recently updated

models 21

datasets 25