Différences

Ci-dessous, les différences entre deux révisions de la page.

--- informatique:ai_lm:ai_nlp_rag [23/04/2026 18:15] – [AI NLP and RAG] cyrille
+++ informatique:ai_lm:ai_nlp_rag [04/06/2026 08:21] (Version actuelle) – [AI NLP and RAG] cyrille
@@ Ligne 25: / Ligne 25: @@
   * Détection d'entités (NER)
     * vise à reconnaître et à classer des entités nommées telles que des personnes, des lieux, des organisations et d'autres informations spécifiques
+ReRanking
+  * Modèles de ReRanking : Utilisation de modèles spécialisés (comme Cross-Encoders) qui comparent directement la question et chaque chunk pour calculer un score de pertinence plus précis.
+  * Fusion de scores : Combinaison de plusieurs critères (pertinence vectorielle, popularité, fraîcheur des données, etc.) pour obtenir un classement final optimisé.
+  * Filtrage des redondances : Suppression des chunks qui se recoupent trop, afin d’éviter de répéter la même information.
+SEQUOIA (Semantic-Evolved QUery-Optimized Iterative Abstraction) is a novel RAG architecture that combines four techniques into a unified retrieval pipeline:
+  - Liste numérotéeSemantic Chunking -- splits documents by embedding similarity boundaries instead of fixed-size windows
+  - RAPTOR Tree -- recursively clusters chunks and summarizes via LLM, building a hierarchy
+  - Step-Back Prompting -- LLM generates a more abstract query; both queries used for retrieval across all tree levels
+  - Confidence-Gated Adaptive Depth -- retrieval starts at leaf level, ascends tree only if confidence is below threshold
+<code>
+query
+  → multi-query expansion (2 rewrites + 1 step-back, via LLM)
+  → hybrid retrieval per variant (BM25 + dense + RRF, top-20 each)
+  → RRF merge across all variants
+  → cross-encoder rerank (top-50 → top-5)
+  → context compression (sentence-level filtering by cosine sim to query,
+                         keep top 12 sentences, collapse into one chunk)
+  → LLM with short-answer prompt
+</code>
 Articles
   * [[https://aimultiple.com/rag-frameworks|Benchmark 5 RAG frameworks: LangChain, LangGraph, LlamaIndex, Haystack, and DSPy]] (2026)
+  * [[https://github.com/Diyago/rag-benchmark/tree/main|RAG Benchmark: comparing 8 retrieval-augmented generation architectures including SEQUOIA]]