This website works better with JavaScript
صفحهٔ اصلی
گشتوگذار
راهنما
ثبت نام
ورود
suby
/
qmd
دنبال کردن
1
ستاره دار
0
انشعاب
0
پروندهها
مشکلات
0
درخواست واکشی
0
ویکی
درخت:
2ad507a86e
شاخهها
تگها
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
تاریخچه Commit ها
یافتن
نویسنده
SHA1
پیام
تاریخ
Tobi Lutke
2ad507a86e
Add chat template leakage detection to reward function
4 ماه پیش
Tobi Lutke
6062dc769f
Add named entity extraction to GRPO reward function
4 ماه پیش
Tobi Lutke
32706a720f
Refactor finetune folder: train/rl scripts with YAML configs
4 ماه پیش