LLM Course documentation
În curând…
0. Configurare
1. Modele Transformer
2. Folosirea 🤗 Transformers
3. Fine-tuning unui model preantrenat
4. Partajarea modelelor și a tokenizatoarelor
5. Biblioteca 🤗 Datasets
6. Biblioteca 🤗 Tokenizers
7. Sarcini clasice NLP
8. Cum să ceri ajutor
9. Construirea și partajarea demo-urilor
10. Curățați seturi de date de înaltă calitate
11. Fine-tuning pentru modele mari de limbaj
12. Construiește Modele de Raționament new
IntroducereÎnvățarea prin Întărire pe LLM-uriMomentul Aha în Lucrarea DeepSeek R1Înțelegerea Avansată a GRPO în DeepSeekMathImplementarea GRPO în TRLExercițiu Practic pentru Ajustarea Fină a unui Model cu GRPOExercițiu Practic cu UnslothÎn curând...
Evenimente Curs
În curând…
Acest capitol se desfășoară acum ca o cohortă live! Dacă ai terminat materialul până acum, iată la ce să te aștepți:
Programul Cursului
| Data | Unitatea |
|---|---|
| ~7 Martie, 2025~ | ~Examen Fără Cod și Certificare~ |
| ~14 Martie, 2025~ | ~Următorul Exercițiu Practic~ |
| 21 Martie, 2025 | Revizuirea interactivă a codului |
| Aprilie 2025 | Mai mult material scris despre construirea modelelor de raționament |
| Aprilie 2025 | Sesiuni live despre construirea Open R1 |
| Aprilie 2025 | Examen de Cod și Certificare |
Să Rămâi la Curent
Dacă vrei să urmezi cursul, urmărește The Reasoning Course și alătură-te comunității Discord!
Update on GitHub