informatique:python:extraire_pages_pdf
Différences
Ci-dessous, les différences entre deux révisions de la page.
| informatique:python:extraire_pages_pdf [09/07/2025 10:19] – créée cyrille | informatique:python:extraire_pages_pdf [09/07/2025 10:21] (Version actuelle) – cyrille | ||
|---|---|---|---|
| Ligne 25: | Ligne 25: | ||
| text = page.extract_text() | text = page.extract_text() | ||
| - | # 🔍 Exemple : chercher un numéro de facture dans le texte | ||
| - | # (à adapter selon le format de tes données) | ||
| match = re.search(r" | match = re.search(r" | ||
| Ligne 34: | Ligne 32: | ||
| nom_fichier = f" | nom_fichier = f" | ||
| - | # Extraire la page avec PyPDF et l’enregistrer | + | # Extraire la page avec PyPDF |
| reader = PdfReader(pdf_path) | reader = PdfReader(pdf_path) | ||
| writer = PdfWriter() | writer = PdfWriter() | ||
| writer.add_page(reader.pages[i]) | writer.add_page(reader.pages[i]) | ||
| - | output_path = os.path.join(output_folder, | ||
| + | # et l’enregistrer | ||
| + | output_path = os.path.join(output_folder, | ||
| with open(output_path, | with open(output_path, | ||
| writer.write(f_out) | writer.write(f_out) | ||
informatique/python/extraire_pages_pdf.1752049186.txt.gz · Dernière modification : de cyrille
