This website works better with JavaScript
Sākums
Izpētīt
Palīdzība
Reģistrēties
Pierakstīties
suby
/
qmd
Vērot
1
Pievienot zvaigznīti
0
Atdalīts
0
Faili
Problēmas
0
Izmaiņu pieprasījumi
0
Vikivietne
Koks:
b16d77146a
Atzari
Tagi
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
Revīziju vēsture
Meklēt
Autors
SHA1
Ziņojums
Datums
Tobi Lütke
189916d6fb
Move GRPO training out of default finetune pipeline
3 mēneši atpakaļ
Tobi Lutke
599935754b
finetune: remove orphaned files and abandoned experiments
3 mēneši atpakaļ
Tobi Lütke
102ff861d3
fix: use Qwen3 recommended sampling params to prevent repetition loops
3 mēneši atpakaļ
Tobi Lütke
bf1b8fc90a
lots of training stuff
3 mēneši atpakaļ