Tobi Lutke
|
b9b1b39a76
Update README with separate model repos
|
4 tháng trước cách đây |
Tobi Lutke
|
312c281109
Update README for unified model repository structure
|
4 tháng trước cách đây |
Tobi Lutke
|
f96766cce8
Fix GRPO model loading to use SFT base first
|
4 tháng trước cách đây |
Tobi Lutke
|
f6a6716c44
Refactor evals into separate run and score scripts
|
4 tháng trước cách đây |
Tobi Lutke
|
6062dc769f
Add named entity extraction to GRPO reward function
|
4 tháng trước cách đây |
Tobi Lutke
|
994a094546
Update README with final evaluation results
|
4 tháng trước cách đây |
Tobi Lutke
|
7cca164dd9
Add query expansion model finetuning infrastructure
|
4 tháng trước cách đây |