|
|
| (2 versions intermédiaires par le même utilisateur non affichées) |
| Ligne 842 : |
Ligne 842 : |
| <syntaxhighlight lang="bash">cat /var/log/syslog | ccze -o html > log.html</syntaxhighlight> | | <syntaxhighlight lang="bash">cat /var/log/syslog | ccze -o html > log.html</syntaxhighlight> |
|
| |
|
| == '''🧰 <code>pdftotext</code> ''' == | | == '''🧰 <code>ExifTool</code> ''' == |
|
| |
|
| '''<code>pdftotext</code>''' est un outil en ligne de commande issu de la suite **Poppler** | | '''ExifTool''' est un outil extrêmement puissant permettant de lire, |
| permettant d’extraire le texte brut contenu dans un fichier PDF.
| | écrire et modifier les métadonnées de fichiers multimédia |
| Il est très utilisé pour l’analyse, l’indexation, la recherche ou le traitement
| | (images, vidéos, PDF, audio, documents bureautiques, etc.). |
| automatisé de documents PDF.
| |
| | |
| ------------------------------------------------------------------------
| |
| | |
| === 📦 '''Installation de pdftotext''' ===
| |
| <syntaxhighlight lang="bash">
| |
| sudo apt install poppler-utils
| |
| </syntaxhighlight>
| |
|
| |
|
| ----- | | ----- |
|
| |
|
| === 🚀 '''Utilisation de base''' === | | === 📦 '''Installation d’ExifTool''' === |
| | |
| <ol style="list-style-type: decimal;">
| |
| <li><p>'''Extraire le texte vers un fichier''' :</p>
| |
| <syntaxhighlight lang="bash">pdftotext document.pdf</syntaxhighlight></li>
| |
| <li><p>'''Extraire le texte vers la sortie standard''' :</p>
| |
| <syntaxhighlight lang="bash">pdftotext document.pdf -</syntaxhighlight></li>
| |
| <li><p>'''Lire le texte directement avec <code>less</code>''' :</p>
| |
| <syntaxhighlight lang="bash">pdftotext document.pdf - | less</syntaxhighlight></li></ol>
| |
|
| |
|
| | | <syntaxhighlight lang="bash" line copy>sudo apt install libimage-exiftool-perl</syntaxhighlight> |
| -----
| |
| === 🔧 '''Options courantes''' ===
| |
| | |
| {| class="wikitable"
| |
| |-
| |
| ! Option
| |
| ! Description
| |
| |-
| |
| | <code>-layout</code>
| |
| | Conserve la mise en page
| |
| |-
| |
| | <code>-raw</code>
| |
| | Extraction brute
| |
| |-
| |
| | <code>-f <n></code>
| |
| | Page de début
| |
| |-
| |
| | <code>-l <n></code>
| |
| | Page de fin
| |
| |-
| |
| | <code>-nopgbrk</code>
| |
| | Supprime les sauts de page
| |
| |-
| |
| | <code>-enc UTF-8</code>
| |
| | Force l’encodage
| |
| |-
| |
| | <code>-help</code>
| |
| | Aide complète
| |
| |}
| |
| | |
| | |
| -----
| |
| | |
| === 💡 '''Exemples pratiques''' ===
| |
| | |
| <ul>
| |
| <li><p>'''Extraire uniquement les pages 2 à 5''' :</p>
| |
| <syntaxhighlight lang="bash">pdftotext -f 2 -l 5 document.pdf</syntaxhighlight></li>
| |
| <li><p>'''Conserver la mise en page''' :</p>
| |
| <syntaxhighlight lang="bash">pdftotext -layout document.pdf</syntaxhighlight></li>
| |
| <li><p>'''Recherche rapide dans un PDF''' :</p>
| |
| <syntaxhighlight lang="bash">pdftotext document.pdf - | grep "mot"</syntaxhighlight></li></ul>
| |
| | |
| | |
| -----
| |
| | |
| === 📌 '''Pourquoi utiliser pdftotext ?''' ===
| |
| | |
| ✅ Extraction rapide du texte ✅ Outil léger et scriptable ✅ Parfait pour OCR / indexation ✅ Intégration facile dans des pipelines shell
| |
| | |
| -----
| |
| == '''🧰 <code>qpdf</code> ''' ==
| |
| | |
| | |
| '''<code>QPDF</code>''' est un outil en ligne de commande permettant de manipuler,
| |
| inspecter et transformer des fichiers PDF.
| |
| Il est couramment utilisé pour le chiffrement, le déchiffrement,
| |
| la réparation et l’optimisation de PDF.
| |
| | |
| ------------------------------------------------------------------------
| |
| | |
| === 📦 '''Installation de qpdf''' ===
| |
| <syntaxhighlight lang="bash"> | |
| sudo apt install qpdf | |
| </syntaxhighlight> | |
|
| |
|
| ----- | | ----- |
| Ligne 940 : |
Ligne 859 : |
|
| |
|
| <ol style="list-style-type: decimal;"> | | <ol style="list-style-type: decimal;"> |
| <li><p>'''Déchiffrer un PDF protégé par mot de passe''' :</p> | | <li><p>'''Afficher toutes les métadonnées''' :</p> |
| <syntaxhighlight lang="bash">qpdf --password=secret --decrypt input.pdf output.pdf</syntaxhighlight></li> | | <syntaxhighlight lang="bash">exiftool image.jpg</syntaxhighlight></li> |
| <li><p>'''Fusionner des PDF''' :</p> | | <li><p>'''Afficher une métadonnée précise''' :</p> |
| <syntaxhighlight lang="bash">qpdf --empty --pages a.pdf b.pdf -- output.pdf</syntaxhighlight></li> | | <syntaxhighlight lang="bash">exiftool -DateTimeOriginal image.jpg</syntaxhighlight></li> |
| <li><p>'''Inspecter la structure d’un PDF''' :</p> | | <li><p>'''Supprimer toutes les métadonnées''' :</p> |
| <syntaxhighlight lang="bash">qpdf --check document.pdf</syntaxhighlight></li></ol> | | <syntaxhighlight lang="bash">exiftool -all= image.jpg</syntaxhighlight></li></ol> |
|
| |
|
|
| |
|
| Ligne 957 : |
Ligne 876 : |
| ! Description | | ! Description |
| |- | | |- |
| | <code>--decrypt</code> | | | <code>-all</code> |
| | Supprime la protection | | | Affiche toutes les métadonnées |
| |- | | |- |
| | <code>--encrypt</code> | | | <code>-json</code> |
| | Chiffre un PDF | | | Sortie JSON |
| |- | | |- |
| | <code>--check</code> | | | <code>-csv</code> |
| | Vérifie l’intégrité | | | Sortie CSV |
| |- | | |- |
| | <code>--pages</code> | | | <code>-overwrite_original</code> |
| | Sélection de pages | | | Écrase le fichier |
| |- | | |- |
| | <code>--linearize</code> | | | <code>-r</code> |
| | Optimisation web | | | Récursif |
| |- | | |- |
| | <code>--show-npages</code> | | | <code>-help</code> |
| | Nombre de pages
| |
| |-
| |
| | <code>--help</code>
| |
| | Aide complète | | | Aide complète |
| |} | | |} |
| Ligne 985 : |
Ligne 901 : |
|
| |
|
| <ul> | | <ul> |
| <li><p>'''Extraire certaines pages''' :</p> | | <li><p>'''Analyser tout un dossier''' :</p> |
| <syntaxhighlight lang="bash">qpdf input.pdf --pages input.pdf 1-5 -- output.pdf</syntaxhighlight></li> | | <syntaxhighlight lang="bash">exiftool -r photos/</syntaxhighlight></li> |
| <li><p>'''Optimiser un PDF pour le web''' :</p> | | <li><p>'''Exporter en JSON''' :</p> |
| <syntaxhighlight lang="bash">qpdf --linearize input.pdf output.pdf</syntaxhighlight></li> | | <syntaxhighlight lang="bash">exiftool -json image.jpg</syntaxhighlight></li> |
| <li><p>'''Afficher le nombre de pages''' :</p> | | <li><p>'''Nettoyer un PDF ou une image avant partage''' :</p> |
| <syntaxhighlight lang="bash">qpdf --show-npages document.pdf</syntaxhighlight></li></ul> | | <syntaxhighlight lang="bash">exiftool -all= document.pdf</syntaxhighlight></li></ul> |
|
| |
|
|
| |
|
| ----- | | ----- |
|
| |
|
| === 📌 '''Pourquoi utiliser QPDF ?''' === | | === 📌 '''Pourquoi utiliser ExifTool ?''' === |
|
| |
|
| ✅ Manipulation PDF avancée ✅ Sécurisation et déchiffrement ✅ Très fiable pour l’automatisation ✅ Aucun rendu graphique nécessaire | | ✅ Contrôle total des métadonnées ✅ Indispensable pour la confidentialité ✅ Supporte des centaines de formats ✅ Outil de référence dans le monde pro |
|
| |
|
| ----- | | ----- |
|
| |
|
| |
|
| |
|
| [[Catégorie: Terminal Tools]] | | [[Catégorie: Terminal Tools]] |