Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2512.15745

LLaDA2.0: Scaling Up Diffusion Language Models to 100B

Paper • 2512.15745 • Published 16 days ago • 76
inclusionAI/LLaDA2.0-flash

Text Generation • 103B • Updated 7 days ago • 428 • 58
inclusionAI/LLaDA2.0-mini

Text Generation • 16B • Updated 7 days ago • 5.15k • 48
inclusionAI/LLaDA2.0-flash-preview

Text Generation • 103B • Updated 7 days ago • 125 • 69

TiDAR: Think in Diffusion, Talk in Autoregression

Paper • 2511.08923 • Published Nov 12 • 117
Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5 • 127
What Makes Diffusion Language Models Super Data Learners?

Paper • 2510.04071 • Published Oct 5
LLaDA2.0: Scaling Up Diffusion Language Models to 100B

Paper • 2512.15745 • Published 16 days ago • 76

about 15 hours ago

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding

Paper • 2505.22618 • Published May 28 • 44
DINGO: Constrained Inference for Diffusion LLMs

Paper • 2505.23061 • Published May 29 • 31
Discrete Diffusion in Large Language and Multimodal Models: A Survey

Paper • 2506.13759 • Published Jun 16 • 43
LongLLaDA: Unlocking Long Context Capabilities in Diffusion LLMs

Paper • 2506.14429 • Published Jun 17 • 44

Scaling Latent Reasoning via Looped Language Models

Paper • 2510.25741 • Published Oct 29 • 221
Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models

Paper • 2511.23319 • Published 27 days ago • 22
Focused Chain-of-Thought: Efficient LLM Reasoning via Structured Input Information

Paper • 2511.22176 • Published 29 days ago • 4
FedRE: A Representation Entanglement Framework for Model-Heterogeneous Federated Learning

Paper • 2511.22265 • Published 29 days ago • 1

Fast-dLLM v2: Efficient Block-Diffusion LLM

Paper • 2509.26328 • Published Sep 30 • 54
Attention Is All You Need for KV Cache in Diffusion LLMs

Paper • 2510.14973 • Published Oct 16 • 40
Attention Sinks in Diffusion Language Models

Paper • 2510.15731 • Published Oct 17 • 48
Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5 • 127

Large Language Diffusion Models

Paper • 2502.09992 • Published Feb 14 • 123
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published Mar 12 • 74
MMaDA: Multimodal Large Diffusion Language Models

Paper • 2505.15809 • Published May 21 • 97
Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective

Paper • 2505.15045 • Published May 21 • 54

LLaDA2.0: Scaling Up Diffusion Language Models to 100B

Paper • 2512.15745 • Published 16 days ago • 76
inclusionAI/LLaDA2.0-flash

Text Generation • 103B • Updated 7 days ago • 428 • 58
inclusionAI/LLaDA2.0-mini

Text Generation • 16B • Updated 7 days ago • 5.15k • 48
inclusionAI/LLaDA2.0-flash-preview

Text Generation • 103B • Updated 7 days ago • 125 • 69

Scaling Latent Reasoning via Looped Language Models

Paper • 2510.25741 • Published Oct 29 • 221
Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models

Paper • 2511.23319 • Published 27 days ago • 22
Focused Chain-of-Thought: Efficient LLM Reasoning via Structured Input Information

Paper • 2511.22176 • Published 29 days ago • 4
FedRE: A Representation Entanglement Framework for Model-Heterogeneous Federated Learning

Paper • 2511.22265 • Published 29 days ago • 1

TiDAR: Think in Diffusion, Talk in Autoregression

Paper • 2511.08923 • Published Nov 12 • 117
Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5 • 127
What Makes Diffusion Language Models Super Data Learners?

Paper • 2510.04071 • Published Oct 5
LLaDA2.0: Scaling Up Diffusion Language Models to 100B

Paper • 2512.15745 • Published 16 days ago • 76

Fast-dLLM v2: Efficient Block-Diffusion LLM

Paper • 2509.26328 • Published Sep 30 • 54
Attention Is All You Need for KV Cache in Diffusion LLMs

Paper • 2510.14973 • Published Oct 16 • 40
Attention Sinks in Diffusion Language Models

Paper • 2510.15731 • Published Oct 17 • 48
Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5 • 127

about 15 hours ago

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding

Paper • 2505.22618 • Published May 28 • 44
DINGO: Constrained Inference for Diffusion LLMs

Paper • 2505.23061 • Published May 29 • 31
Discrete Diffusion in Large Language and Multimodal Models: A Survey

Paper • 2506.13759 • Published Jun 16 • 43
LongLLaDA: Unlocking Long Context Capabilities in Diffusion LLMs

Paper • 2506.14429 • Published Jun 17 • 44

Large Language Diffusion Models

Paper • 2502.09992 • Published Feb 14 • 123
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published Mar 12 • 74
MMaDA: Multimodal Large Diffusion Language Models

Paper • 2505.15809 • Published May 21 • 97
Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective

Paper • 2505.15045 • Published May 21 • 54

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs