« Logiciels terminal » : différence entre les versions

Aucun résumé des modifications
Balise : Révoqué
Aucun résumé des modifications
 
(3 versions intermédiaires par le même utilisateur non affichées)
Ligne 842 : Ligne 842 :
<syntaxhighlight lang="bash">cat /var/log/syslog | ccze -o html > log.html</syntaxhighlight>
<syntaxhighlight lang="bash">cat /var/log/syslog | ccze -o html > log.html</syntaxhighlight>


== '''🧰 <code>pdftotext</code> ''' ==
== '''🧰 <code>ExifTool</code> ''' ==


'''<code>pdftotext</code>''' est un outil en ligne de commande issu de la suite **Poppler**
'''ExifTool''' est un outil extrêmement puissant permettant de lire,
permettant d’extraire le texte brut contenu dans un fichier PDF
écrire et modifier les métadonnées de fichiers multimédia
Il est très utilisé pour l’analyse, l’indexation, la recherche ou le traitement
(images, vidéos, PDF, audio, documents bureautiques, etc.).
automatisé de documents PDF.


------------------------------------------------------------------------
-----


=== 📦 '''Installation de pdftotext''' ===
=== 📦 '''Installation d’ExifTool''' ===
<syntaxhighlight lang="bash">
 
sudo apt install poppler-utils
<syntaxhighlight lang="bash" line copy>sudo apt install libimage-exiftool-perl</syntaxhighlight>
</syntaxhighlight>


-----
-----
Ligne 861 : Ligne 859 :


<ol style="list-style-type: decimal;">
<ol style="list-style-type: decimal;">
<li><p>'''Extraire le texte vers un fichier''' :</p>
<li><p>'''Afficher toutes les métadonnées''' :</p>
<syntaxhighlight lang="bash">pdftotext document.pdf</syntaxhighlight></li>
<syntaxhighlight lang="bash">exiftool image.jpg</syntaxhighlight></li>
<li><p>'''Extraire le texte vers la sortie standard''' :</p>
<li><p>'''Afficher une métadonnée précise''' :</p>
<syntaxhighlight lang="bash">pdftotext document.pdf -</syntaxhighlight></li>
<syntaxhighlight lang="bash">exiftool -DateTimeOriginal image.jpg</syntaxhighlight></li>
<li><p>'''Lire le texte directement avec <code>less</code>''' :</p>
<li><p>'''Supprimer toutes les métadonnées''' :</p>
<syntaxhighlight lang="bash">pdftotext document.pdf - | less</syntaxhighlight></li></ol>
<syntaxhighlight lang="bash">exiftool -all= image.jpg</syntaxhighlight></li></ol>




-----
-----
=== 🔧 '''Options courantes''' ===
=== 🔧 '''Options courantes''' ===


Ligne 877 : Ligne 876 :
! Description
! Description
|-
|-
| <code>-layout</code>
| <code>-all</code>
| Conserve la mise en page
| Affiche toutes les métadonnées
|-
| <code>-raw</code>
| Extraction brute
|-
|-
| <code>-f &lt;n&gt;</code>
| <code>-json</code>
| Page de début
| Sortie JSON
|-
|-
| <code>-l &lt;n&gt;</code>
| <code>-csv</code>
| Page de fin
| Sortie CSV
|-
|-
| <code>-nopgbrk</code>
| <code>-overwrite_original</code>
| Supprime les sauts de page
| Écrase le fichier
|-
|-
| <code>-enc UTF-8</code>
| <code>-r</code>
| Force l’encodage
| Récursif
|-
|-
| <code>-help</code>
| <code>-help</code>
Ligne 905 : Ligne 901 :


<ul>
<ul>
<li><p>'''Extraire uniquement les pages 2 à 5''' :</p>
<li><p>'''Analyser tout un dossier''' :</p>
<syntaxhighlight lang="bash">pdftotext -f 2 -l 5 document.pdf</syntaxhighlight></li>
<syntaxhighlight lang="bash">exiftool -r photos/</syntaxhighlight></li>
<li><p>'''Conserver la mise en page''' :</p>
<li><p>'''Exporter en JSON''' :</p>
<syntaxhighlight lang="bash">pdftotext -layout document.pdf</syntaxhighlight></li>
<syntaxhighlight lang="bash">exiftool -json image.jpg</syntaxhighlight></li>
<li><p>'''Recherche rapide dans un PDF''' :</p>
<li><p>'''Nettoyer un PDF ou une image avant partage''' :</p>
<syntaxhighlight lang="bash">pdftotext document.pdf - | grep "mot"</syntaxhighlight></li></ul>
<syntaxhighlight lang="bash">exiftool -all= document.pdf</syntaxhighlight></li></ul>




-----
-----


=== 📌 '''Pourquoi utiliser pdftotext ?''' ===
=== 📌 '''Pourquoi utiliser ExifTool ?''' ===
 
✅ Extraction rapide du texte ✅ Outil léger et scriptable ✅ Parfait pour OCR / indexation ✅ Intégration facile dans des pipelines shell


✅ Contrôle total des métadonnées ✅ Indispensable pour la confidentialité ✅ Supporte des centaines de formats ✅ Outil de référence dans le monde pro


-----
-----


[[Catégorie: Terminal Tools]]
[[Catégorie: Terminal Tools]]