''RTX 3060 en Thunderbolt 4 (thb4)'' le modèle le plus adapté avec llama.cpp est ''gpt-oss-20b-UD-Q4_K_X... monkey.com/en/compare_cpu-intel_core_ultra_7_270k_plus-vs-intel_core_i7_1360p|Core i7-1360P vs Core Ultra 7 270K Plus]]
[[https://lab.cyrille.giquello.fr/AI-compare/m... odèle fondation entraîné à partir de zéro, est le plus gros modèle fondation qui a été entraîné sur plus
* Tokenisation
* décompose un texte en unités plus petites, appelées tokens. Ces tokens peuvent être... chaque chunk pour calculer un score de pertinence plus précis.
* Fusion de scores : Combinaison de plu... milvus.io/docs/fr/overview.md|milvus]]
Solutions plus évoluées en SaaS
* [[https://www.pinecone.io/|P... 0260105/wikidata-20260105-all.json.gz
* 151 Go, plus de ''118 654 999'' lignes
Dump RDF N-Triples (br
T.''"
😩 voilà qu'après plusieurs usages il n'y a plus de Markdown pour les titres ...
👌 J'ai changé de stratégie: ne plus extraire la mise en forme, mais seulement le text... ltats pour la structure en Markdown mais beaucoup plus gourmand en mémoire et donc plus lent à cause de l'usage du CPU, même avec du Q4. 😩
<code>
~/Code/bron
nt les physiques qui seront utilisés. Si on force plus de thread, les perfs diminuent.
* le multi-th... r avec PCIe x16 et Intel(R) Core(TM) Ultra 7 270K Plus.
**Environnement et compilation sensible** pour ... ree)
- CPU : Intel(R) Core(TM) Ultra 7 270K Plus (93508 MiB, 93508 MiB free)
system_info: n_thread
iptions'' + un gros ''System Prompt'' il ne reste plus beaucoup de ''Context Window'' pour le reste. Aus... strateurs =====
==== Openclaw ====
OpenClaw est plus un "gateway" pour communiquer avec des agents.
=
l'action, et les temps de réflexion sont beaucoup plus long (il itère beaucoup)
* j'ai du corrigé ... ec-alerts-map.Gpt-Oss-20B/index.html|Démo]]
* plus efficace que le ''120B'', tout en étant toujours