This website works better with JavaScript
Inicio
Explorar
Ayuda
Registro
Iniciar sesión
suby
/
qmd
Seguir
1
Destacar
0
Fork
0
Archivos
Incidencias
0
Pull Requests
0
Wiki
Árbol:
9b3a209a97
Ramas
Etiquetas
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
Historial de Commits
Buscar
Autor
SHA1
Mensaje
Fecha
Tobi Lutke
9b3a209a97
Fix GRPO training: apply chat template to prompts
hace 4 meses
Tobi Lutke
891f3262cf
Fix GRPO reward function to handle think blocks and end tokens
hace 4 meses
Tobi Lutke
8a1c4cdab0
Add 1.7B and 4B GRPO training and GGUF conversion scripts
hace 4 meses