Tobi Lütke 189916d6fb Move GRPO training out of default finetune pipeline преди 3 месеца
..
accelerate_multi_gpu.yaml bf1b8fc90a lots of training stuff преди 3 месеца
sft.yaml cbeeb1f89b Add wall-clock checkpoints and full eval defaults преди 3 месеца
sft_local.yaml cbeeb1f89b Add wall-clock checkpoints and full eval defaults преди 3 месеца