toutes les options
buster  ] [  bullseye  ] [  bookworm  ] [  trixie  ] [  sid  ]
[ Paquet source : ocrmypdf  ]

Paquet : ocrmypdf (10.3.1+dfsg-1)

Liens pour ocrmypdf

Screenshot

Ressources Debian :

Télécharger le paquet source ocrmypdf :

Responsable :

Ressources externes :

Paquets similaires :

ajout d’un calque de texte issu de ROC aux fichiers PDF

OCRmyPDF génère un fichier PDF/A navigable à partir d'un PDF normal ne contenant que des images, ce qui permet de faire des recherches à l'intérieur.

Il utilise le moteur de ROC Tesseract et gère donc toutes les langues prises en charge par Tesseract.

Quelques autres fonctions importantes :

 – mise du texte de ROC précisément sous l'image pour faciliter le
   copier/coller ;
 – conservation de la résolution exacte des images embarquées originales ;
 – si possible, insertion des informations de ROC sans perte en
   n'affichant pas les informations vectorielles ;
 – conservation d’une taille de fichier à peu près identique ;
 – redressement ou nettoyage de l’image, si demandé, avant d'effectuer
   la ROC ;
 – validation des fichiers d'entrée et de sortie ;
 – fourniture d’un mode de débogage pour permettre une vérification
   facile des résultats de la ROC ;
 – traitement des pages en parallèle si plus d'un cœur de processeur
   est disponible ;
 – abondamment testé sur des milliers de PDF, une suite de tests et
   une intégration continue.

Autres paquets associés à ocrmypdf

  • dépendances
  • recommandations
  • suggestions
  • enhances

Télécharger ocrmypdf

Télécharger pour toutes les architectures proposées
Architecture Taille du paquet Espace occupé une fois installé Fichiers
all 141,5 ko558,0 ko [liste des fichiers]