Tobi Lütke 189916d6fb Move GRPO training out of default finetune pipeline před 3 měsíci
..
accelerate_multi_gpu.yaml bf1b8fc90a lots of training stuff před 3 měsíci
sft.yaml cbeeb1f89b Add wall-clock checkpoints and full eval defaults před 3 měsíci
sft_local.yaml cbeeb1f89b Add wall-clock checkpoints and full eval defaults před 3 měsíci