Historie revizí

Autor SHA1 Zpráva Datum
  Tobias Lütke 55c951b15e Merge pull request #349 from byheaven/fix/qwen3-embedding-model-filename-case před 2 měsíci
  Tobi Lutke 55f16460d0 fix(ci): guard LLM calls in CI and increase test timeouts před 2 měsíci
  Tobi Lutke c68904fe08 refactor: move CLI and MCP to subdirectories, MCP consumes SDK před 2 měsíci
  YuBai 740b17b485 docs: fix Qwen3-Embedding GGUF filename case in README and llm.ts před 2 měsíci
  Tobi Lutke ad38c1f698 feat: add intent parameter for query disambiguation před 2 měsíci
  Tobi Lutke e3549dab1a perf(rerank): cap parallelism, deduplicate chunks, cache by content před 2 měsíci
  Tobias Lütke 7904ab9a9d Merge pull request #273 from daocoding/feature/configurable-embed-model před 2 měsíci
  Tobias Lütke ee08997f23 Merge pull request #313 from 0xble/fix/expand-context-size-config před 2 měsíci
  Brian Le 0dec1df047 fix(llm): make expansion context size configurable před 2 měsíci
  Gilad S. 3095041e0f feat: use `build: "autoAttempt"` on `getLlama` před 2 měsíci
  Big (daocoding) b71649b12d feat: add QMD_EMBED_MODEL env var for multilingual embedding support před 2 měsíci
  Tobi Lütke 5233e676d9 fix(rerank): truncate documents exceeding 2048-token context size před 3 měsíci
  Tobias Lütke 67e2aab18c Merge pull request #206 from tobi/liquidai-query-expansion před 3 měsíci
  Tobi Lütke 57f7caa93b feat: add LiquidAI LFM2 support for query expansion před 3 měsíci
  Tobi Lutke 09803a75b7 feat: compile to JS for npm, release system, full changelog před 3 měsíci
  Tobi Lütke 392934e78a perf: CPU parallelism via multi-context thread splitting před 3 měsíci
  Tobi Lütke 0a941c442f perf: flash attention, right-sized contexts, cleaner GPU detection před 3 měsíci
  Tobi Lütke 4ac95b5e26 perf: adaptive parallel contexts for embed + rerank, fix VRAM waste před 3 měsíci
  Tobi Lütke 0a0e1e6f29 perf: parallel reranking with multiple contexts (2.7x speedup) před 3 měsíci
  Tobi Lütke ee86bba45e feat: auto-detect GPU acceleration + device info in status před 3 měsíci
  Tobi Lütke 102ff861d3 fix: use Qwen3 recommended sampling params to prevent repetition loops před 3 měsíci
  Tobi Lütke 479b68bbf1 add qmd model pull and refresh logic před 3 měsíci
  Tobi Lutke 7de18ee066 Merge main into finetune před 3 měsíci
  Tobi Lutke 785620467a refactor: reorder output format to put hyde line first před 3 měsíci
  Tobi Lütke 32d313ad6b Add LLM session management for lifecycle safety před 3 měsíci
  Christopher Jones 6d9871d2f5 Fix DisposedError during slow batch embedding (#41) před 3 měsíci
  Tobias Lütke eb1b77c8cb Deploy fine-tuned GRPO model as default query expansion (#67) před 3 měsíci
  Tobi Lutke 8572c2fd94 Deploy fine-tuned GRPO model as default for query expansion před 3 měsíci
  Freeman Jiang bfb0eebc3e fix: use sequential embedding on CPU-only systems to avoid race condition (#54) před 3 měsíci
  Sergey Gavrilyuk bebee61bec Fix case sensitivity in Qwen3-1.7B model filename před 4 měsíci