This website works better with JavaScript
首页
发现
帮助
注册
登录
suby
/
qmd
关注
1
点赞
0
派生
0
文件
工单管理
0
合并请求
0
Wiki
目录树:
891f3262cf
分支列表
标签列表
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
提交历史
查找
作者
SHA1
备注
提交日期
Tobi Lutke
891f3262cf
Fix GRPO reward function to handle think blocks and end tokens
4 月之前
Tobi Lutke
8a1c4cdab0
Add 1.7B and 4B GRPO training and GGUF conversion scripts
4 月之前