Специализированный конвертер · работает на 100% в браузере
Создание PDF с текстовым слоем (OCR)
Добавьте невидимый текстовый слой OCR к отсканированному PDF, чтобы он стал доступным для поиска и индексирования, сохраняя оригинальные изображения страниц. Каждая страница отрисовывается, распознаётся и перестраивается с наложением текста в правильных координатах. Результат — стандартный PDF, который открывается в любом читалке.
Как использовать
- Перетащите файл PDF.
- Выберите язык документа из списка.
- Tesseract.js загружает языковые данные (~10 МБ на язык, кэшируется после первого использования).
- OCR выполняется локально, результирующий PDF с текстовым слоем предлагается для скачивания.
FAQ
Насколько точен OCR?
Tesseract — один из лучших OCR-движков с открытым исходным кодом. Для чистого, современного текста точность обычно составляет 95–99%. Рукописный текст, низкоконтрастные сканы или необычные шрифты могут существенно снизить точность.
Почему первая конвертация занимает некоторое время?
При первом запуске загружается ~10–15 МБ языковых данных. После этого они кэшируются до конца вашей сессии.
Загружается ли мой документ или изображение на сервер?
Нет. Конвертация полностью выполняется в браузере с помощью WebAssembly и Web API. Откройте вкладку Network в DevTools во время конвертации — вы не увидите исходящего трафика с вашим файлом.
Это действительно бесплатно?
Да. Без регистрации, без квот, без платных уровней. Конвертация выполняется на вашем устройстве, поэтому нам это ничего не стоит.