This website works better with JavaScript
Startsida
Utforska
Hjälp
Registrera dig
Logga in
suby
/
qmd
Bevaka
1
Stjärnmärk
0
Fork
0
Filer
Ärenden
0
Pull-förfrågningar
0
Wiki
Träd:
2ad507a86e
Grenar
Taggar
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
Commit History
Sök
Upphovsman
SHA1
Meddelande
Datum
Tobi Lutke
2ad507a86e
Add chat template leakage detection to reward function
4 månader sedan
Tobi Lutke
6062dc769f
Add named entity extraction to GRPO reward function
4 månader sedan
Tobi Lutke
32706a720f
Refactor finetune folder: train/rl scripts with YAML configs
4 månader sedan