| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente |
| informatique:ai_lm:gpu_bench [16/03/2026 16:45] – [Stabilité] cyrille | informatique:ai_lm:gpu_bench [16/03/2026 17:04] (Version actuelle) – [Stabilité] cyrille |
|---|
| Après 2 mois de re-essais avec des configs grub et modprobe de toutes sortes avec l'aide de forums et d'assistants (Claude, ChatGpt, LeChat), une solution apparaît [[https://github.com/NVIDIA/open-gpu-kernel-modules/issues/974|sur ce ticket]] : forcer le PCI en "Gen 3" | Après 2 mois de re-essais avec des configs grub et modprobe de toutes sortes avec l'aide de forums et d'assistants (Claude, ChatGpt, LeChat), une solution apparaît [[https://github.com/NVIDIA/open-gpu-kernel-modules/issues/974|sur ce ticket]] : forcer le PCI en "Gen 3" |
| |
| <code bash> | <code> |
| # Pour récupérer l'adresse PCI "0000:05:00.0" de la RTX: | # Pour récupérer l'adresse PCI "0000:05:00.0" de la RTX: |
| lspci | grep -i nvidia | lspci | grep -i nvidia |
| |
| sudo lspci -vvv -s 0000:05:00.0 | grep -i "LnkCap\|LnkSta" | sudo lspci -vvv -s 0000:05:00.0 | grep -i "LnkCap\|LnkSta" |
| | LnkCap: Port #0, Speed 32GT/s, Width x8, ASPM L1, Exit Latency L1 unlimited |
| | LnkSta: Speed 8GT/s (downgraded), Width x4 (downgraded) |
| | LnkCap2: Supported Link Speeds: 2.5-32GT/s, Crosslink- Retimer+ 2Retimers+ DRS- |
| | LnkSta2: Current De-emphasis Level: -6dB, EqualizationComplete+ EqualizationPhase1+ |
| |
| sudo setpci -s 0000:05:00.0 CAP_EXP+0xC.W=0x0003 | sudo setpci -s 0000:05:00.0 CAP_EXP+0xC.W=0x0003 |
| |
| sudo lspci -vvv -s 0000:05:00.0 | grep -i "LnkCap\|LnkSta" | sudo lspci -vvv -s 0000:05:00.0 | grep -i "LnkCap\|LnkSta" |
| | LnkCap: Port #0, Speed 32GT/s, Width x8, ASPM L1, Exit Latency L1 unlimited |
| | LnkSta: Speed 2.5GT/s (downgraded), Width x4 (downgraded) |
| | LnkCap2: Supported Link Speeds: 2.5-32GT/s, Crosslink- Retimer+ 2Retimers+ DRS- |
| | LnkSta2: Current De-emphasis Level: -6dB, EqualizationComplete+ EqualizationPhase1+ |
| </code> | </code> |
| |
| | **Mais non**, ça a bien fonctionné avec ''llama-bench'' mais pas avec Yolo: |
| | |
| | <code> |
| | kernel: NVRM: GPU at PCI:0000:05:00: GPU-ab296f23-e6a6-a23b-b6c1-33f9b813df84 |
| | kernel: NVRM: GPU Board Serial Number: 0 |
| | kernel: NVRM: Xid (PCI:0000:05:00): 13, Graphics Exception: Class 0xffff Subchannel 0x0 Mismatch |
| | kernel: NVRM: Xid (PCI:0000:05:00): 13, Graphics Exception: ESR 0x4041b0=0x3f20ffff |
| | kernel: NVRM: Xid (PCI:0000:05:00): 13, Graphics Exception: ESR 0x404000=0x80000002 |
| | kernel: NVRM: Xid (PCI:0000:05:00): 13, pid=6871, name=python3, Graphics Exception: channel 0x00000002, Class 0000cec0, Offset 00000100, Data deaddead |
| | </code> |
| | |
| ===== Traduction ===== | ===== Traduction ===== |
| |