Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2409.12186

Phi-4 Technical Report

Paper • 2412.08905 • Published Dec 12, 2024 • 122
Evaluating and Aligning CodeLLMs on Human Preference

Paper • 2412.05210 • Published Dec 6, 2024 • 50
Evaluating Language Models as Synthetic Data Generators

Paper • 2412.03679 • Published Dec 4, 2024 • 48
Yi-Lightning Technical Report

Paper • 2412.01253 • Published Dec 2, 2024 • 28

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152

Qwen/Qwen2.5-Coder-32B-Instruct

Text Generation • 33B • Updated Jan 12 • 291k • • 1.96k
Qwen/Qwen2.5-Coder-7B-Instruct

Text Generation • 8B • Updated Jan 12 • 674k • • 570
Qwen/Qwen2.5-Coder-32B-Instruct-GGUF

Text Generation • 33B • Updated Jan 12 • 16.1k • 177
dphn/dolphin-2.9.2-qwen2-72b

Text Generation • 73B • Updated Oct 8, 2024 • 787 • 170

big yay for open the sauce day

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152
Qwen/Qwen2.5-Coder-1.5B-Instruct-GGUF

Text Generation • 2B • Updated Nov 12, 2024 • 29.9k • 26
Qwen/Qwen2-0.5B-Instruct-GGUF

Text Generation • 0.5B • Updated Aug 21, 2024 • 9.04k • 67

LLMs + Persona-Plug = Personalized LLMs

Paper • 2409.11901 • Published Sep 18, 2024 • 35
To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning

Paper • 2409.12183 • Published Sep 18, 2024 • 39
Chain of Thought Empowers Transformers to Solve Inherently Serial Problems

Paper • 2402.12875 • Published Feb 20, 2024 • 13
TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices

Paper • 2410.00531 • Published Oct 1, 2024 • 34

Running

2.97k

AnyCoder

🏆

2.97k

Generate code with AI
Running

Featured

274

Qwen2.5 Coder Artifacts

🐢

274

Generate code snippets based on user input
Running

Featured

922

QwQ-32B-Preview

🔍

922

QwQ-32B-Preview
Running on CPU Upgrade

13.7k

Open LLM Leaderboard

🏆

13.7k

Track, rank and evaluate open LLMs and chatbots

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31, 2024 • 117
Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 167
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152
Mistral 7B

Paper • 2310.06825 • Published Oct 10, 2023 • 55

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152

LLM Tech Report

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 376
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152
Qwen2.5-Math Technical Report: Toward Mathematical Expert Model via Self-Improvement

Paper • 2409.12122 • Published Sep 18, 2024 • 4
Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published Feb 19 • 211

Phi-4 Technical Report

Paper • 2412.08905 • Published Dec 12, 2024 • 122
Evaluating and Aligning CodeLLMs on Human Preference

Paper • 2412.05210 • Published Dec 6, 2024 • 50
Evaluating Language Models as Synthetic Data Generators

Paper • 2412.03679 • Published Dec 4, 2024 • 48
Yi-Lightning Technical Report

Paper • 2412.01253 • Published Dec 2, 2024 • 28

Running

2.97k

AnyCoder

🏆

2.97k

Generate code with AI
Running

Featured

274

Qwen2.5 Coder Artifacts

🐢

274

Generate code snippets based on user input
Running

Featured

922

QwQ-32B-Preview

🔍

922

QwQ-32B-Preview
Running on CPU Upgrade

13.7k

Open LLM Leaderboard

🏆

13.7k

Track, rank and evaluate open LLMs and chatbots

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152

Qwen/Qwen2.5-Coder-32B-Instruct

Text Generation • 33B • Updated Jan 12 • 291k • • 1.96k
Qwen/Qwen2.5-Coder-7B-Instruct

Text Generation • 8B • Updated Jan 12 • 674k • • 570
Qwen/Qwen2.5-Coder-32B-Instruct-GGUF

Text Generation • 33B • Updated Jan 12 • 16.1k • 177
dphn/dolphin-2.9.2-qwen2-72b

Text Generation • 73B • Updated Oct 8, 2024 • 787 • 170

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31, 2024 • 117
Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 167
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152
Mistral 7B

Paper • 2310.06825 • Published Oct 10, 2023 • 55

big yay for open the sauce day

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152
Qwen/Qwen2.5-Coder-1.5B-Instruct-GGUF

Text Generation • 2B • Updated Nov 12, 2024 • 29.9k • 26
Qwen/Qwen2-0.5B-Instruct-GGUF

Text Generation • 0.5B • Updated Aug 21, 2024 • 9.04k • 67

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152

LLMs + Persona-Plug = Personalized LLMs

Paper • 2409.11901 • Published Sep 18, 2024 • 35
To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning

Paper • 2409.12183 • Published Sep 18, 2024 • 39
Chain of Thought Empowers Transformers to Solve Inherently Serial Problems

Paper • 2402.12875 • Published Feb 20, 2024 • 13
TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices

Paper • 2410.00531 • Published Oct 1, 2024 • 34

LLM Tech Report

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 376
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152
Qwen2.5-Math Technical Report: Toward Mathematical Expert Model via Self-Improvement

Paper • 2409.12122 • Published Sep 18, 2024 • 4
Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published Feb 19 • 211

Previous
1
2
3
4
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs