This website works better with JavaScript
Главная
Обзор
Помощь
Регистрация
Вход
suby
/
qmd
Следить
1
В избранное
0
Ответвить
0
Файлы
Задачи
0
Запросы на слияние
0
Вики
Дерево:
2ad507a86e
Ветки
Метки
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
История коммитов
Найти
Автор
SHA1
Сообщение
Дата
Tobi Lutke
2ad507a86e
Add chat template leakage detection to reward function
4 месяцев назад
Tobi Lutke
6062dc769f
Add named entity extraction to GRPO reward function
4 месяцев назад
Tobi Lutke
32706a720f
Refactor finetune folder: train/rl scripts with YAML configs
4 месяцев назад