Пакет: ocrmypdf (8.0.1+dfsg-1)

Ссылки для ocrmypdf

Ресурсы Debian:

Исходный код ocrmypdf:

Сопровождающий:

Sean Whitton (Страница КК)

Внешние ресурсы:

Сайт [github.com]

Подобные пакеты:

добавление текстового слоя OCR в файлы PDF

OCRmyPDF создаёт файл PDF/A с возможностью поиска из обычного файла PDF, содержащего только изображения.

Программа использует систему оптического распознавания символов (OCR) Tesseract, поэтому возможно использовать для распознавания все языки поддерживаемые этой системой.

Основные особенности:

  * Аккуратное размещение текста за изображением для копирования текста в
    буфер обмена
  * Сохранение точного разрешения оригинальных встроенных изображений
  * При возможности, добавление OCR-информации операцией не допускающей
    потерь, без перевода векторной графики в растровую
  * Размер файла практически не изменяется
  * Возможность компенсации наклона и/или очистки изображения перед
    распознаванием текста
  * Проверка входного и выходного файлов
  * Режим отладки для упрощения проверки результата распознавания текста
  * Параллельная обработка страниц при наличии более одного ядра процессора
  * Проверено боем на тысячах файлов PDF, комплекте тестов и непрерывной
    интеграцией

Другие пакеты, относящиеся к ocrmypdf

зависимости

рекомендации

предложения

enhances

dep: ghostscript (>= 9.18~dfsg~)

интерпретатор для языка PostScript и для PDF
dep: icc-profiles-free

ICC color profiles for use with color profile aware software
dep: liblept5

image processing library
dep: python3

интерактивный высокоуровневый объектно-ориентированный язык (версия python3 по умолчанию)
dep: python3-cffi-backend-api-max (>= 9729)

Пакет недоступен
dep: python3-cffi-backend-api-min (<= 9729)

Пакет недоступен
dep: python3-chardet

universal character encoding detector for Python3
dep: python3-img2pdf (>= 0.3.0)

Lossless conversion of raster images to PDF (library)
dep: python3-pdfminer (>= 20181108+dfsg-3)

PDF parser and analyser (Python3)
dep: python3-pikepdf

Python library to read and write PDFs with QPDF
dep: python3-pil

библиотека для работы с растровой графикой (Python3)
dep: python3-pkg-resources

обнаружение пакетов и доступ к ресурсам через pkg_resources
dep: python3-reportlab

ReportLab library to create PDF documents using Python3
dep: python3-ruffus (>= 2.8)

Python3 computation pipeline library widely used in bioinformatics
dep: qpdf (>= 8.0.2)

инструменты для преобразования и анализа PDF-файлов
dep: tesseract-ocr (>= 4.0.0)

консольная утилита для распознавания текста
dep: zlib1g

библиотека сжатия

rec: pngquant

PNG (Portable Network Graphics) image optimising utility
rec: unpaper

инструмент постобработки сканированных страниц

sug: img2pdf

Lossless conversion of raster images to PDF
sug: ocrmypdf-doc

add an OCR text layer to PDF files - documentation
sug: python-watchdog

Python API and shell utilities to monitor file system events - Python 2.x

Загрузка ocrmypdf

Загрузить для всех доступных архитектур
Архитектура	Размер пакета	В установленном виде	Файлы
all	109,5 Кб	431,0 Кб	[список файлов]