NoManDeRY
/

DPO-Shift-Qwen-2-7B-Ultrafeedback-fixed-1.0

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DPO-Shift-Qwen-2-7B-Ultrafeedback-fixed-1.0

Commit History

Update README.md

6578f0c
verified

NoManDeRY commited on Feb 18, 2025

Update README.md

8c42e3a
verified

NoManDeRY commited on Feb 18, 2025

Update README.md

121bce2
verified

NoManDeRY commited on Feb 18, 2025

Upload folder using huggingface_hub

3f33393
verified

NoManDeRY commited on Feb 17, 2025

initial commit

eeb5d88
verified

NoManDeRY commited on Feb 17, 2025