<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="FeedCreator 1.8" -->
<?xml-stylesheet href="https://cyrille.giquello.fr/lib/exe/css.php?s=feed" type="text/css"?>
<rss version="2.0">
    <channel xmlns:g="http://base.google.com/ns/1.0">
        <title>Cyrille Giquello - informatique:ai_lm:gpu_bench</title>
        <description></description>
        <link>https://cyrille.giquello.fr/</link>
        <lastBuildDate>Fri, 03 Jul 2026 00:50:51 +0000</lastBuildDate>
        <generator>FeedCreator 1.8</generator>
        <image>
            <url>https://cyrille.giquello.fr/_media/wiki/dokuwiki.svg</url>
            <title>Cyrille Giquello</title>
            <link>https://cyrille.giquello.fr/</link>
        </image>
        <item>
            <title>llama-cpp_mtp</title>
            <link>https://cyrille.giquello.fr/informatique/ai_lm/gpu_bench/llama-cpp_mtp</link>
            <description>Multi-Tokens Prediction

	*  llama.cpp docs/speculative.md

Ce bench n&#039;est pas pertinent à cause de :

	*  défaut connu de l&#039;implémentation draft-mtp
	*  sur les modèles MoE
	*  avec VRAM limitée sous CUDA

Avec “Nvidia RTX 5060 Ti 16 Go” + “Intel Core Ultra 7 270K +”</description>
            <author>anonymous@undisclosed.example.com (Anonymous)</author>
            <pubDate>Thu, 02 Jul 2026 16:44:27 +0000</pubDate>
        </item>
    </channel>
</rss>
