llama.cpp/convert_hf_to_gguf_update.py at gg/scripts-eval

mirror of https://github.com/ggml-org/llama.cpp.git synced 2026-03-17 16:44:07 +00:00

Files

JJJYmmm fc0fe40049 models : support qwen3.5 series (#19468 )

* support qwen3.5 series

* remove deepstack for now, and some code clean

* code clean

* add FULL_ATTENTION_INTERVAL metadata

* code clean

* reorder v heads for linear attention to avoid expensive interleaved repeat

2026-02-10 18:00:26 +02:00

25 KiB

Executable File

Raw Permalink Blame History

View Raw

25 KiB Executable File Raw Permalink Blame History

25 KiB

Executable File

Raw Permalink Blame History