« Logiciels terminal » : différence entre les versions

Aucun résumé des modifications
Balise : Révoqué
Ligne 842 : Ligne 842 :
<syntaxhighlight lang="bash">cat /var/log/syslog | ccze -o html > log.html</syntaxhighlight>
<syntaxhighlight lang="bash">cat /var/log/syslog | ccze -o html > log.html</syntaxhighlight>


== '''🧰 <code>pdftotext</code> ''' ==
'''<code>pdftotext</code>'''  est un outil en ligne de commande issu de la suite **Poppler**
permettant d’extraire le texte brut contenu dans un fichier PDF. 
Il est très utilisé pour l’analyse, l’indexation, la recherche ou le traitement
automatisé de documents PDF.
------------------------------------------------------------------------
=== 📦 '''Installation de pdftotext''' ===
<syntaxhighlight lang="bash">
sudo apt install poppler-utils
</syntaxhighlight>
-----
=== 🚀 '''Utilisation de base''' ===
<ol style="list-style-type: decimal;">
<li><p>'''Extraire le texte vers un fichier''' :</p>
<syntaxhighlight lang="bash">pdftotext document.pdf</syntaxhighlight></li>
<li><p>'''Extraire le texte vers la sortie standard''' :</p>
<syntaxhighlight lang="bash">pdftotext document.pdf -</syntaxhighlight></li>
<li><p>'''Lire le texte directement avec <code>less</code>''' :</p>
<syntaxhighlight lang="bash">pdftotext document.pdf - | less</syntaxhighlight></li></ol>
-----
=== 🔧 '''Options courantes''' ===
{| class="wikitable"
|-
! Option
! Description
|-
| <code>-layout</code>
| Conserve la mise en page
|-
| <code>-raw</code>
| Extraction brute
|-
| <code>-f &lt;n&gt;</code>
| Page de début
|-
| <code>-l &lt;n&gt;</code>
| Page de fin
|-
| <code>-nopgbrk</code>
| Supprime les sauts de page
|-
| <code>-enc UTF-8</code>
| Force l’encodage
|-
| <code>-help</code>
| Aide complète
|}
-----
=== 💡 '''Exemples pratiques''' ===
<ul>
<li><p>'''Extraire uniquement les pages 2 à 5''' :</p>
<syntaxhighlight lang="bash">pdftotext -f 2 -l 5 document.pdf</syntaxhighlight></li>
<li><p>'''Conserver la mise en page''' :</p>
<syntaxhighlight lang="bash">pdftotext -layout document.pdf</syntaxhighlight></li>
<li><p>'''Recherche rapide dans un PDF''' :</p>
<syntaxhighlight lang="bash">pdftotext document.pdf - | grep "mot"</syntaxhighlight></li></ul>
-----
=== 📌 '''Pourquoi utiliser pdftotext ?''' ===
✅ Extraction rapide du texte ✅ Outil léger et scriptable ✅ Parfait pour OCR / indexation ✅ Intégration facile dans des pipelines shell
-----




[[Catégorie: Terminal Tools]]
[[Catégorie: Terminal Tools]]