Cyrille Giquello - informatique:ai_lm:gpu

Cyrille Giquello - informatique:ai_lm:gpu_bench https://cyrille.giquello.fr/ Fri, 03 Jul 2026 00:50:51 +0000 FeedCreator 1.8 https://cyrille.giquello.fr/_media/wiki/dokuwiki.svg Cyrille Giquello https://cyrille.giquello.fr/ llama-cpp_mtp https://cyrille.giquello.fr/informatique/ai_lm/gpu_bench/llama-cpp_mtp Multi-Tokens Prediction * llama.cpp docs/speculative.md Ce bench n'est pas pertinent à cause de : * défaut connu de l'implémentation draft-mtp * sur les modèles MoE * avec VRAM limitée sous CUDA Avec “Nvidia RTX 5060 Ti 16 Go” + “Intel Core Ultra 7 270K +” anonymous@undisclosed.example.com (Anonymous) Thu, 02 Jul 2026 16:44:27 +0000