oire tampon circulaire ou d’une fenêtre contextuelle (context window), qui contient une quantité limit... A]]
* [[https://www.linkedin.com/posts/godefroy_le-rag-est-mort-voici-pourquoi-en-2022-activity-7387725857659723776-h3ff|Le RAG est mort. Voici pourquoi]]. Article comparent RAG et GREP ; les commentaires sont une bonne sourc
ia|ai_coding]]
* Agents réflexes simples / simple reflex agent
* Agents basés sur des modèles / m... code editors/IDEs and coding agents and is suitable for both local and remote scenarios.
* [[https... AG, embeddings ...
* [[https://research.aimultiple.com/rag-frameworks/|RAG frameworks benchmark resu... ====
Les contraintes des LLM:
* Éviter un modèle dédié : au lieu de créer (entraîner) un modèle su
dèles multimodaux, sans entraînement spécifique.
Le prompt demande s'il y a des panneaux solaire dans... ermettent d'éliminer des faux positifs.
Par exemplele modèle trouve un panneau solaire dans cette image, mais ne trouve pas les coordonnées géo, on peut do
e 2025-11
Benchmark d'IA pour [[https://lab.cyrille.giquello.fr/Anticor/graphLmExtract.html|extraction de noms]] :
* avec service Mistral, modèle Codestral = ''00j 01h 02m 48s''
* RTX3060 + Intel-i7, modèle granite-4.0-h-small-Q8_0 = ''02j 16h 11m 34s''
... "CUDA error" apparaissent avec la RTX 5060 Ti et le bridge PCIe/THB4 "Wikingoo L17" et le driver nvid
dex
* [[https://github.com/AnswerDotAI/RAGatouille|RAGatouille]] : bridging the gap between state-of-the-art research and alchemical RAG pipeline practi... in.com/oss/python/integrations/providers/ragatouille|provider]] or [[https://docs.langchain.com/oss/python/integrations/retrievers/ragatouille|retriever]]
* [[https://github.com/stanford-fut
r
===== Docker et Php STDIO =====
Pour utiliser le transport STDIO il faut que le moteur soit dans le container, en l’occurrence Php.
Le Dockerfile, un mix avec les images ''ghcr.io/modelcontextprotocol
] est un PoC pour l'exécution de tâches, basé sur le framework [[https://github.com/LLPhant/LLPhant|LL... nai-php/client|openai-php/client]], pour imaginer le R2-D2 sachant tout faire : [[https://www.youtube.... anvier 2024)
====== Définition des tâches ======
Le prompt AutoPhp , un peu modifié pour insister sur... ortance de la question aka ''objectif'' : une réelle différence entre ''organise'' et ''créé''.
L'obj
====== Model bench ======
Avec OpenCode et le prompt "hello".
gemma-4-26B-A4B-it-Q4_K_M
''~/Code/br... 0.20.076.470 I srv update_slots: all slots are idle
0.35.420.649 I srv params_from_: Chat format: pe... 2.43.175.638 I srv update_slots: all slots are idle
</code>
gpt-oss-20b-UD-Q4_K_XL
''~/Code/bronx/A... 0.14.412.697 I srv update_slots: all slots are idle
0.53.838.855 I srv params_from_: Chat format: pe