This website works better with JavaScript
Startseite
Erkunden
Hilfe
Registrieren
Anmelden
suby
/
qmd
Beobachten
1
Favorit hinzufügen
0
Fork
0
Dateien
Issues
0
Pull-Requests
0
Wiki
Struktur:
9b3a209a97
Branches
Tags
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
Commit Verlauf
Finden
Autor
SHA1
Nachricht
Datum
Tobi Lutke
9b3a209a97
Fix GRPO training: apply chat template to prompts
vor 4 Monaten
Tobi Lutke
891f3262cf
Fix GRPO reward function to handle think blocks and end tokens
vor 4 Monaten
Tobi Lutke
8a1c4cdab0
Add 1.7B and 4B GRPO training and GGUF conversion scripts
vor 4 Monaten