Différences

Ci-dessous, les différences entre deux révisions de la page.

--- informatique:ai_lm:ai_nlp_rag [04/06/2026 08:14] – [AI NLP and RAG] cyrille
+++ informatique:ai_lm:ai_nlp_rag [04/06/2026 08:21] (Version actuelle) – [AI NLP and RAG] cyrille
@@ Ligne 25: / Ligne 25: @@
   * Détection d'entités (NER)
     * vise à reconnaître et à classer des entités nommées telles que des personnes, des lieux, des organisations et d'autres informations spécifiques
+ReRanking
+  * Modèles de ReRanking : Utilisation de modèles spécialisés (comme Cross-Encoders) qui comparent directement la question et chaque chunk pour calculer un score de pertinence plus précis.
+  * Fusion de scores : Combinaison de plusieurs critères (pertinence vectorielle, popularité, fraîcheur des données, etc.) pour obtenir un classement final optimisé.
+  * Filtrage des redondances : Suppression des chunks qui se recoupent trop, afin d’éviter de répéter la même information.
 SEQUOIA (Semantic-Evolved QUery-Optimized Iterative Abstraction) is a novel RAG architecture that combines four techniques into a unified retrieval pipeline:
@@ Ligne 31: / Ligne 37: @@
   - Step-Back Prompting -- LLM generates a more abstract query; both queries used for retrieval across all tree levels
   - Confidence-Gated Adaptive Depth -- retrieval starts at leaf level, ascends tree only if confidence is below threshold
+<code>
+query
+  → multi-query expansion (2 rewrites + 1 step-back, via LLM)
+  → hybrid retrieval per variant (BM25 + dense + RRF, top-20 each)
+  → RRF merge across all variants
+  → cross-encoder rerank (top-50 → top-5)
+  → context compression (sentence-level filtering by cosine sim to query,
+                         keep top 12 sentences, collapse into one chunk)
+  → LLM with short-answer prompt
+</code>
 Articles