Outils pour utilisateurs

Outils du site


informatique:ai_lm:ai_nlp_rag

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
informatique:ai_lm:ai_nlp_rag [23/04/2026 18:15] – [AI NLP and RAG] cyrilleinformatique:ai_lm:ai_nlp_rag [04/06/2026 08:21] (Version actuelle) – [AI NLP and RAG] cyrille
Ligne 25: Ligne 25:
   * Détection d'entités (NER)   * Détection d'entités (NER)
     * vise à reconnaître et à classer des entités nommées telles que des personnes, des lieux, des organisations et d'autres informations spécifiques     * vise à reconnaître et à classer des entités nommées telles que des personnes, des lieux, des organisations et d'autres informations spécifiques
 +
 +ReRanking
 +  * Modèles de ReRanking : Utilisation de modèles spécialisés (comme Cross-Encoders) qui comparent directement la question et chaque chunk pour calculer un score de pertinence plus précis.
 +  * Fusion de scores : Combinaison de plusieurs critères (pertinence vectorielle, popularité, fraîcheur des données, etc.) pour obtenir un classement final optimisé.
 +  * Filtrage des redondances : Suppression des chunks qui se recoupent trop, afin d’éviter de répéter la même information.
 +
 +
 +SEQUOIA (Semantic-Evolved QUery-Optimized Iterative Abstraction) is a novel RAG architecture that combines four techniques into a unified retrieval pipeline:
 +  - Liste numérotéeSemantic Chunking -- splits documents by embedding similarity boundaries instead of fixed-size windows
 +  - RAPTOR Tree -- recursively clusters chunks and summarizes via LLM, building a hierarchy
 +  - Step-Back Prompting -- LLM generates a more abstract query; both queries used for retrieval across all tree levels
 +  - Confidence-Gated Adaptive Depth -- retrieval starts at leaf level, ascends tree only if confidence is below threshold
 +
 +<code>
 +query
 +  → multi-query expansion (2 rewrites + 1 step-back, via LLM)
 +  → hybrid retrieval per variant (BM25 + dense + RRF, top-20 each)
 +  → RRF merge across all variants
 +  → cross-encoder rerank (top-50 → top-5)
 +  → context compression (sentence-level filtering by cosine sim to query,
 +                         keep top 12 sentences, collapse into one chunk)
 +  → LLM with short-answer prompt
 +</code>
 +
  
 Articles Articles
   * [[https://aimultiple.com/rag-frameworks|Benchmark 5 RAG frameworks: LangChain, LangGraph, LlamaIndex, Haystack, and DSPy]] (2026)   * [[https://aimultiple.com/rag-frameworks|Benchmark 5 RAG frameworks: LangChain, LangGraph, LlamaIndex, Haystack, and DSPy]] (2026)
 +  * [[https://github.com/Diyago/rag-benchmark/tree/main|RAG Benchmark: comparing 8 retrieval-augmented generation architectures including SEQUOIA]]
  
  
informatique/ai_lm/ai_nlp_rag.1776960948.txt.gz · Dernière modification : de cyrille

Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC0 1.0 Universal
CC0 1.0 Universal Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki