Спеціалізований конвертер · працює на 100% у вашому браузері

PDF в PDF з можливістю пошуку OCR

Додайте невидимий текстовий шар OCR до відсканованого PDF-файлу, щоб у ньому можна було шукати та індексувати, зберігаючи оригінальні зображення сторінки. Кожна сторінка візуалізується, розпізнається та перебудовується з текстом, накладеним на зображення в правильних координатах. Вихід — стандартний PDF-файл, який відкривається в будь-якій програмі для читання.

Немає завантаженняБез реєстраціїНемає відстеженняБезкоштовно, без обмежень
Перетягніть свій файл PDF сюди
або натисніть, щоб вибрати файл

Як користуватися

  1. Відпустіть свій файл PDF.
  2. Виберіть мову документа зі спадного списку.
  3. Tesseract.js завантажує дані мови (~10 МБ на мову, кешується після першого використання).
  4. OCR працює локально, і доступний для пошуку PDF-файл доступний для завантаження. Конвертер

Поширені запитання

Наскільки точним є OCR?

Tesseract є одним із найкращих механізмів оптичного розпізнавання тексту з відкритим кодом. Для чистого сучасного тексту це зазвичай 95-99% точності. Рукописний текст, сканування з низьким контрастом або незвичайні шрифти можуть значно знизити точність.

Чому перше перетворення займає деякий час?

Перший запуск завантажує ~10-15 МБ мовних даних. Після цього він кешується до кінця вашого сеансу.

Чи завантажується мій документ або зображення на сервер?

Ні. Перетворення повністю виконується у вашому браузері за допомогою WebAssembly та веб-API. Під час конвертації відкрийте вкладку «Мережа» в DevTools — ви не побачите вихідного трафіку, що переносить ваш файл.

Це дійсно безкоштовно?

Так. Без реєстрації, без квоти, без рівня оновлення. Перетворення виконується на вашому комп’ютері, тому розміщення нам не коштує нічого.