Outils pour utilisateurs

Outils du site


informatique:ai_lm:ai_nlp_rag

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
informatique:ai_lm:ai_nlp_rag [04/06/2026 08:14] – [AI NLP and RAG] cyrilleinformatique:ai_lm:ai_nlp_rag [04/06/2026 08:21] (Version actuelle) – [AI NLP and RAG] cyrille
Ligne 25: Ligne 25:
   * Détection d'entités (NER)   * Détection d'entités (NER)
     * vise à reconnaître et à classer des entités nommées telles que des personnes, des lieux, des organisations et d'autres informations spécifiques     * vise à reconnaître et à classer des entités nommées telles que des personnes, des lieux, des organisations et d'autres informations spécifiques
 +
 +ReRanking
 +  * Modèles de ReRanking : Utilisation de modèles spécialisés (comme Cross-Encoders) qui comparent directement la question et chaque chunk pour calculer un score de pertinence plus précis.
 +  * Fusion de scores : Combinaison de plusieurs critères (pertinence vectorielle, popularité, fraîcheur des données, etc.) pour obtenir un classement final optimisé.
 +  * Filtrage des redondances : Suppression des chunks qui se recoupent trop, afin d’éviter de répéter la même information.
 +
  
 SEQUOIA (Semantic-Evolved QUery-Optimized Iterative Abstraction) is a novel RAG architecture that combines four techniques into a unified retrieval pipeline: SEQUOIA (Semantic-Evolved QUery-Optimized Iterative Abstraction) is a novel RAG architecture that combines four techniques into a unified retrieval pipeline:
Ligne 31: Ligne 37:
   - Step-Back Prompting -- LLM generates a more abstract query; both queries used for retrieval across all tree levels   - Step-Back Prompting -- LLM generates a more abstract query; both queries used for retrieval across all tree levels
   - Confidence-Gated Adaptive Depth -- retrieval starts at leaf level, ascends tree only if confidence is below threshold   - Confidence-Gated Adaptive Depth -- retrieval starts at leaf level, ascends tree only if confidence is below threshold
 +
 +<code>
 +query
 +  → multi-query expansion (2 rewrites + 1 step-back, via LLM)
 +  → hybrid retrieval per variant (BM25 + dense + RRF, top-20 each)
 +  → RRF merge across all variants
 +  → cross-encoder rerank (top-50 → top-5)
 +  → context compression (sentence-level filtering by cosine sim to query,
 +                         keep top 12 sentences, collapse into one chunk)
 +  → LLM with short-answer prompt
 +</code>
 +
  
 Articles Articles
informatique/ai_lm/ai_nlp_rag.1780553687.txt.gz · Dernière modification : de cyrille

Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC0 1.0 Universal
CC0 1.0 Universal Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki