informatique:ai_lm:ai_nlp_rag
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| informatique:ai_lm:ai_nlp_rag [04/06/2026 08:10] – [AI NLP and RAG] cyrille | informatique:ai_lm:ai_nlp_rag [04/06/2026 08:21] (Version actuelle) – [AI NLP and RAG] cyrille | ||
|---|---|---|---|
| Ligne 25: | Ligne 25: | ||
| * Détection d' | * Détection d' | ||
| * vise à reconnaître et à classer des entités nommées telles que des personnes, des lieux, des organisations et d' | * vise à reconnaître et à classer des entités nommées telles que des personnes, des lieux, des organisations et d' | ||
| + | |||
| + | ReRanking | ||
| + | * Modèles de ReRanking : Utilisation de modèles spécialisés (comme Cross-Encoders) qui comparent directement la question et chaque chunk pour calculer un score de pertinence plus précis. | ||
| + | * Fusion de scores : Combinaison de plusieurs critères (pertinence vectorielle, | ||
| + | * Filtrage des redondances : Suppression des chunks qui se recoupent trop, afin d’éviter de répéter la même information. | ||
| + | |||
| SEQUOIA (Semantic-Evolved QUery-Optimized Iterative Abstraction) is a novel RAG architecture that combines four techniques into a unified retrieval pipeline: | SEQUOIA (Semantic-Evolved QUery-Optimized Iterative Abstraction) is a novel RAG architecture that combines four techniques into a unified retrieval pipeline: | ||
| Ligne 31: | Ligne 37: | ||
| - Step-Back Prompting -- LLM generates a more abstract query; both queries used for retrieval across all tree levels | - Step-Back Prompting -- LLM generates a more abstract query; both queries used for retrieval across all tree levels | ||
| - Confidence-Gated Adaptive Depth -- retrieval starts at leaf level, ascends tree only if confidence is below threshold | - Confidence-Gated Adaptive Depth -- retrieval starts at leaf level, ascends tree only if confidence is below threshold | ||
| + | |||
| + | < | ||
| + | query | ||
| + | → multi-query expansion (2 rewrites + 1 step-back, via LLM) | ||
| + | → hybrid retrieval per variant (BM25 + dense + RRF, top-20 each) | ||
| + | → RRF merge across all variants | ||
| + | → cross-encoder rerank (top-50 → top-5) | ||
| + | → context compression (sentence-level filtering by cosine sim to query, | ||
| + | keep top 12 sentences, collapse into one chunk) | ||
| + | → LLM with short-answer prompt | ||
| + | </ | ||
| + | |||
| Articles | Articles | ||
| * [[https:// | * [[https:// | ||
| + | * [[https:// | ||
informatique/ai_lm/ai_nlp_rag.1780553426.txt.gz · Dernière modification : de cyrille
