This website works better with JavaScript
Trang chủ
Khám phá
Trợ giúp
Đăng ký
Đăng nhập
suby
/
qmd
Xem
1
Star
0
Fork
0
Các tập tin
Các vấn đề
0
Yêu cầu kéo về
0
Wiki
Tree:
9b3a209a97
Branches
Tags
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
Lịch sử commit
Tìm kiếm
Tác giả
SHA1
Thông báo
Ngày
Tobi Lutke
9b3a209a97
Fix GRPO training: apply chat template to prompts
4 tháng trước cách đây
Tobi Lutke
891f3262cf
Fix GRPO reward function to handle think blocks and end tokens
4 tháng trước cách đây
Tobi Lutke
8a1c4cdab0
Add 1.7B and 4B GRPO training and GGUF conversion scripts
4 tháng trước cách đây