This website works better with JavaScript
Startseite
Erkunden
Hilfe
Registrieren
Anmelden
suby
/
qmd
Beobachten
1
Favorit hinzufügen
0
Fork
0
Dateien
Issues
0
Pull-Requests
0
Wiki
Struktur:
2ad507a86e
Branches
Tags
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
Commit Verlauf
Finden
Autor
SHA1
Nachricht
Datum
Tobi Lutke
2ad507a86e
Add chat template leakage detection to reward function
vor 4 Monaten
Tobi Lutke
6062dc769f
Add named entity extraction to GRPO reward function
vor 4 Monaten
Tobi Lutke
32706a720f
Refactor finetune folder: train/rl scripts with YAML configs
vor 4 Monaten