This website works better with JavaScript
Начало
Каталог
Помощ
Регистрация
Вход
suby
/
qmd
Наблюдаван
1
Харесван
0
Разклонения
0
Файлове
Задачи
0
Заявки за сливане
0
Уики
ИН на ревизия:
9b3a209a97
Клонове
Маркери
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
Commit History
Намери
Автор
SHA1
Съобщение
Дата
Tobi Lutke
9b3a209a97
Fix GRPO training: apply chat template to prompts
преди 4 месеца
Tobi Lutke
891f3262cf
Fix GRPO reward function to handle think blocks and end tokens
преди 4 месеца
Tobi Lutke
8a1c4cdab0
Add 1.7B and 4B GRPO training and GGUF conversion scripts
преди 4 месеца