This website works better with JavaScript
Página Principal
Explorar
Ajuda
Registe-se
Iniciar Sessão
suby
/
qmd
Vigiar
1
Colocar Estrela
0
Fork
0
Ficheiros
Problemas
0
Pull Requests
0
Wiki
Árvore:
f6a6716c44
Ramos
Etiquetas
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
Histórico de Commits
Pesquisar
Autor
SHA1
Mensagem
Data
Tobi Lutke
dc8f5a2335
Strict format validation: every line must be lex:/vec:/hyde:
há 4 meses atrás
Tobi Lutke
2ad507a86e
Add chat template leakage detection to reward function
há 4 meses atrás
Tobi Lutke
6062dc769f
Add named entity extraction to GRPO reward function
há 4 meses atrás
Tobi Lutke
32706a720f
Refactor finetune folder: train/rl scripts with YAML configs
há 4 meses atrás