Outils pour utilisateurs

Outils du site


informatique:python:extraire_pages_pdf

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

informatique:python:extraire_pages_pdf [09/07/2025 10:19] – créée cyrilleinformatique:python:extraire_pages_pdf [09/07/2025 10:21] (Version actuelle) cyrille
Ligne 25: Ligne 25:
         text = page.extract_text()         text = page.extract_text()
  
-        # 🔍 Exemple : chercher un numéro de facture dans le texte 
-        # (à adapter selon le format de tes données) 
         match = re.search(r"Facture\s*:\s*(\w+)", text)         match = re.search(r"Facture\s*:\s*(\w+)", text)
  
Ligne 34: Ligne 32:
             nom_fichier = f"page_{i+1}"  # nom générique si rien trouvé             nom_fichier = f"page_{i+1}"  # nom générique si rien trouvé
  
-        # Extraire la page avec PyPDF et l’enregistrer+        # Extraire la page avec PyPDF
         reader = PdfReader(pdf_path)         reader = PdfReader(pdf_path)
         writer = PdfWriter()         writer = PdfWriter()
         writer.add_page(reader.pages[i])         writer.add_page(reader.pages[i])
-        output_path = os.path.join(output_folder, f"{nom_fichier}.pdf") 
  
 +        # et l’enregistrer
 +        output_path = os.path.join(output_folder, f"{nom_fichier}.pdf")
         with open(output_path, "wb") as f_out:         with open(output_path, "wb") as f_out:
             writer.write(f_out)             writer.write(f_out)
informatique/python/extraire_pages_pdf.1752049186.txt.gz · Dernière modification : de cyrille

Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC0 1.0 Universal
CC0 1.0 Universal Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki