Спеціалізований конвертер · працює на 100% у вашому браузері

OCR PDF у TXT

Витягніть текст зі сканованого або зображеного PDF-файлу за допомогою OCR (Tesseract.js + pdf.js). Кожна сторінка відображається на полотні та оптично розпізнається. Працює для документів, текст яких не можна вибрати. Перебіг багатосторінкового перегляду відображається під час перетворення.

Немає завантаженняБез реєстраціїНемає відстеженняБезкоштовно, без обмежень
Перетягніть свій файл PDF сюди
або натисніть, щоб вибрати файл

Як користуватися

  1. Відпустіть свій файл PDF.
  2. Виберіть мову документа зі спадного списку.
  3. Tesseract.js завантажує дані мови (~10 МБ на мову, кешується після першого використання).
  4. OCR працює локально, а вихідні дані TXT пропонуються для завантаження.

Поширені запитання

Наскільки точним є OCR?

Tesseract є одним із найкращих механізмів оптичного розпізнавання тексту з відкритим кодом. Для чистого сучасного тексту це зазвичай 95-99% точності. Рукописний текст, сканування з низьким контрастом або незвичайні шрифти можуть значно знизити точність.

Чому перше перетворення займає деякий час?

Перший запуск завантажує ~10-15 МБ мовних даних. Після цього він кешується до кінця вашого сеансу.

Чи завантажується мій документ або зображення на сервер?

Ні. Перетворення повністю виконується у вашому браузері за допомогою WebAssembly та веб-API. Під час конвертації відкрийте вкладку «Мережа» в DevTools — ви не побачите вихідного трафіку, що переносить ваш файл.

Це дійсно безкоштовно?

Так. Без реєстрації, без квоти, без рівня оновлення. Перетворення виконується на вашому комп’ютері, тому розміщення нам не коштує нічого.