64 GB RAM - Linux (Fedora)
./llama-server -m /opt/models/Qwen3VL-4B-Instruct-Q4_K_M.gguf \
--mmproj /opt/models/mmproj-Qwen3VL-4B-Instruct-Q8_0.gguf \
--jinja -b 1024 -t 8 -ngl 99 --temp 0.7 --top-k 20 \
--top-p 0.8 --min-p 0.01 --repeat-penalty 1.05 --ctx-size 65536
./llama-server -m /opt/models/Qwen3-Coder-Next-UD-Q2_K_XL.gguf
--jinja --ctx-size 32768 \
--temp 1.0 --top-p 0.95 --min-p 0.01 --top-k 40 --fit on
./llama-server -m /opt/models/Qwen3-Coder-Next-Q2_K.gguf --jinja --ctx-size 16384 --temp 1.0 --top-p 0.95 --min-p 0.01 --top-k 40 --fit on
./llama-server -m /opt/models/GLM-4.7-Flash-Q4_K_M.gguf --jinja --ctx-size 16384 --temp 1.0 --top-p 0.95 --min-p 0.01 --fit on