Linux tools PDF
Compresser PDF (ghostscript)
gs -q -dSAFER -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook -sOUTPUTFILE=fichier_outout.pdf -f input.pdf
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/prepress -dNOPAUSE -dQUIET -dBATCH -sOutputFile=fichier_outout_prepress.pdf input.pdf
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/printer -dNOPAUSE -dQUIET -dBATCH -sOutputFile=fichier_outout_printer.pdf input.pdf
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=fichier_outout_ebook.pdf input.pdf
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=fichier_outout_screen.pdf input.pdf
Convert img to pdf (img2pdf)
sudo apt-get install img2pdf
img2pdf test.png -o outcome.pdf
🧰 pdftk
pdftk est un outil pour fusionner des fichiers pdf
🚀 Utilisation de base
sudo apt-get install pdftk
pdftk fichier1.pdf fichier2.pdf cat output fichier3.pdf
pdftk mon-document.pdf output mon-document.comprimé.pdf compress
🧰 pdftotext
pdftotext est un outil en ligne de commande issu de la suite **Poppler**
permettant d’extraire le texte brut contenu dans un fichier PDF.
Il est très utilisé pour l’analyse, l’indexation, la recherche ou le traitement
automatisé de documents PDF.
📦 Installation de pdftotext
sudo apt install poppler-utils
🚀 Utilisation de base
Extraire le texte vers un fichier :
pdftotext document.pdfExtraire le texte vers la sortie standard :
pdftotext document.pdf -
Lire le texte directement avec
less:pdftotext document.pdf - | less
🔧 Options courantes
| Option | Description |
|---|---|
-layout
|
Conserve la mise en page |
-raw
|
Extraction brute |
-f <n>
|
Page de début |
-l <n>
|
Page de fin |
-nopgbrk
|
Supprime les sauts de page |
-enc UTF-8
|
Force l’encodage |
-help
|
Aide complète |
💡 Exemples pratiques
Extraire uniquement les pages 2 à 5 :
pdftotext -f 2 -l 5 document.pdf
Conserver la mise en page :
pdftotext -layout document.pdf
Recherche rapide dans un PDF :
pdftotext document.pdf - | grep "mot"
📌 Pourquoi utiliser pdftotext ?
✅ Extraction rapide du texte ✅ Outil léger et scriptable ✅ Parfait pour OCR / indexation ✅ Intégration facile dans des pipelines shell
🧰 qpdf
QPDF est un outil en ligne de commande permettant de manipuler,
inspecter et transformer des fichiers PDF.
Il est couramment utilisé pour le chiffrement, le déchiffrement,
la réparation et l’optimisation de PDF.
📦 Installation de qpdf
sudo apt install qpdf
🚀 Utilisation de base
Déchiffrer un PDF protégé par mot de passe :
qpdf --password=secret --decrypt input.pdf output.pdf
Fusionner des PDF :
qpdf --empty --pages a.pdf b.pdf -- output.pdf
Inspecter la structure d’un PDF :
qpdf --check document.pdf
🔧 Options courantes
| Option | Description |
|---|---|
--decrypt
|
Supprime la protection |
--encrypt
|
Chiffre un PDF |
--check
|
Vérifie l’intégrité |
--pages
|
Sélection de pages |
--linearize
|
Optimisation web |
--show-npages
|
Nombre de pages |
--help
|
Aide complète |
💡 Exemples pratiques
Extraire certaines pages :
qpdf input.pdf --pages input.pdf 1-5 -- output.pdf
Optimiser un PDF pour le web :
qpdf --linearize input.pdf output.pdf
Afficher le nombre de pages :
qpdf --show-npages document.pdf
📌 Pourquoi utiliser QPDF ?
✅ Manipulation PDF avancée ✅ Sécurisation et déchiffrement ✅ Très fiable pour l’automatisation ✅ Aucun rendu graphique nécessaire