lisant son **contexte maximale "131072" avec ''<nowiki>--ctx-size 0</nowiki>'' au lieu du par défaut "4096"** il faut décharger des layers sur le CPU, sinon c... context max 131072 c'est 30 layers sur GPU : ''<nowiki>--n-gpu-layers 30</nowiki>'', donc 80% perte perf
* ''<nowiki>--ctx-size 70000 --n-gpu-layers 41</n