Спеціалізований конвертер · працює на 100% у вашому браузері
PDF в PDF з можливістю пошуку OCR
Додайте невидимий текстовий шар OCR до відсканованого PDF-файлу, щоб у ньому можна було шукати та індексувати, зберігаючи оригінальні зображення сторінки. Кожна сторінка візуалізується, розпізнається та перебудовується з текстом, накладеним на зображення в правильних координатах. Вихід — стандартний PDF-файл, який відкривається в будь-якій програмі для читання.
Як користуватися
- Відпустіть свій файл PDF.
- Виберіть мову документа зі спадного списку.
- Tesseract.js завантажує дані мови (~10 МБ на мову, кешується після першого використання).
- OCR працює локально, і доступний для пошуку PDF-файл доступний для завантаження. Конвертер
Поширені запитання
Наскільки точним є OCR?
Tesseract є одним із найкращих механізмів оптичного розпізнавання тексту з відкритим кодом. Для чистого сучасного тексту це зазвичай 95-99% точності. Рукописний текст, сканування з низьким контрастом або незвичайні шрифти можуть значно знизити точність.
Чому перше перетворення займає деякий час?
Перший запуск завантажує ~10-15 МБ мовних даних. Після цього він кешується до кінця вашого сеансу.
Чи завантажується мій документ або зображення на сервер?
Ні. Перетворення повністю виконується у вашому браузері за допомогою WebAssembly та веб-API. Під час конвертації відкрийте вкладку «Мережа» в DevTools — ви не побачите вихідного трафіку, що переносить ваш файл.
Це дійсно безкоштовно?
Так. Без реєстрації, без квоти, без рівня оновлення. Перетворення виконується на вашому комп’ютері, тому розміщення нам не коштує нічого.