Zefan Cai's picture

4 12 1

Zefan Cai

ZefanCai

·

AI & ML interests

None yet

Recent Activity

updated a dataset about 24 hours ago

ZefanCai/Video-Reasoning-Clean

updated a dataset 11 days ago

ZefanCai/VideoKV

updated a dataset 11 days ago

ZefanCai/VideoKV

View all activity

Organizations

upvoted a paper 17 days ago

Can World Simulators Reason? Gen-ViRe: A Generative Visual Reasoning Benchmark

Paper • 2511.13853 • Published 19 days ago • 34

upvoted a paper about 1 month ago

MMPersuade: A Dataset and Evaluation Framework for Multimodal Persuasion

Paper • 2510.22768 • Published Oct 26 • 7

upvoted 2 papers 5 months ago

A Survey on Latent Reasoning

Paper • 2507.06203 • Published Jul 8 • 93

Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving

Paper • 2507.06229 • Published Jul 8 • 75

upvoted a paper 6 months ago

VisualToolAgent (VisTA): A Reinforcement Learning Framework for Visual Tool Selection

Paper • 2505.20289 • Published May 26 • 10

upvoted a paper 9 months ago

Multimodal Representation Alignment for Image Generation: Text-Image Interleaved Control Is Easier Than You Think

Paper • 2502.20172 • Published Feb 27 • 29

upvoted a paper 10 months ago

HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading

Paper • 2502.12574 • Published Feb 18 • 12

upvoted 3 papers about 1 year ago

Omni-MATH: A Universal Olympiad Level Mathematic Benchmark For Large Language Models

Paper • 2410.07985 • Published Oct 10, 2024 • 32

Pyramidal Flow Matching for Efficient Video Generative Modeling

Paper • 2410.05954 • Published Oct 8, 2024 • 40

Towards a Unified View of Preference Learning for Large Language Models: A Survey

Paper • 2409.02795 • Published Sep 4, 2024 • 72

upvoted 2 papers about 2 years ago

Towards End-to-End Embodied Decision Making via Multi-modal Large Language Model: Explorations with GPT4-Vision and Beyond

Paper • 2310.02071 • Published Oct 3, 2023 • 4

MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning

Paper • 2309.07915 • Published Sep 14, 2023 • 4