informatique:ai_lm:ai_nlp
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| informatique:ai_lm:ai_nlp [16/01/2026 13:27] – [Wikidata] cyrille | informatique:ai_lm:ai_nlp [18/01/2026 10:16] (Version actuelle) – [Wikidata] cyrille | ||
|---|---|---|---|
| Ligne 58: | Ligne 58: | ||
| ==== Wikidata ==== | ==== Wikidata ==== | ||
| + | |||
| + | Utiliser 2 méthodes différentes pour | ||
| + | * Pour extraire les labels, aliases et déclarations (claims) | ||
| + | * Pour extraire le graph des P31/P279 | ||
| + | permet d' | ||
| + | |||
| + | === Wikidata Dumps === | ||
| Il y a des dumps Wikidata (préférer un mirroir pour être sympa). | Il y a des dumps Wikidata (préférer un mirroir pour être sympa). | ||
| Ligne 63: | Ligne 70: | ||
| Dump Json, streamable (GZ) : | Dump Json, streamable (GZ) : | ||
| * https:// | * https:// | ||
| - | * 151 Go, plus de 118 654 999 lignes | + | * 151 Go, plus de '' |
| Dump RDF N-Triples (brut), streamable (GZ) : | Dump RDF N-Triples (brut), streamable (GZ) : | ||
| Ligne 71: | Ligne 78: | ||
| Dump RDF N-Triples (brut), streamable (GZ) ET nettoyé des '' | Dump RDF N-Triples (brut), streamable (GZ) ET nettoyé des '' | ||
| * https:// | * https:// | ||
| - | * 65 Go 👌 | + | * 69.6 Go 👌 pour '' |
| + | |||
| + | Lectures: | ||
| + | * PDF [[https:// | ||
| - | Pour être optimale, il faut les 2 types: | + | Query services: |
| - | * Pour extraire les labels, aliases et déclarations (claims) le JSON est plus facile. | + | * Original https:// |
| - | * Pour extraire le graph c' | + | * The graph was split in two some time ago. The scholarly articles must be queried on https:// |
| + | * QLever démo https:// | ||
informatique/ai_lm/ai_nlp.1768566435.txt.gz · Dernière modification : de cyrille
