This website works better with JavaScript
Etusivu
Tutki
Apua
Rekisteröidy
Kirjaudu sisään
suby
/
qmd
Tarkkaile
1
Äänestä
0
Fork
0
Tiedostot
Ongelmat
0
Pull-pyynnöt
0
Wiki
Puu:
891f3262cf
Haarat
Tagit
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
Commitin historia
Etsi
Tekijä
SHA1
Viesti
Päivämäärä
Tobi Lutke
891f3262cf
Fix GRPO reward function to handle think blocks and end tokens
4 kuukautta sitten
Tobi Lutke
8a1c4cdab0
Add 1.7B and 4B GRPO training and GGUF conversion scripts
4 kuukautta sitten