Tobi Lutke 32706a720f Refactor finetune folder: train/rl scripts with YAML configs 4 tháng trước cách đây
..
grpo_v4.yaml 32706a720f Refactor finetune folder: train/rl scripts with YAML configs 4 tháng trước cách đây
sft_v4.yaml 32706a720f Refactor finetune folder: train/rl scripts with YAML configs 4 tháng trước cách đây