Специализиран конвертор · работи 100% във вашия браузър

PDF към PDF с възможност за търсене OCR

Добавете невидим текстов слой за OCR към сканиран PDF файл, така че да може да се търси + да се индексира, като същевременно запазите оригиналните изображения на страницата. Всяка страница се изобразява, разпознава и възстановява с текст, положен върху изображението в правилните координати. Изходът е стандартен PDF, който се отваря във всеки четец.

Без качванеНяма регистрацияБез проследяванеБезплатно, неограничено
Пуснете своя PDF файл тук
или щракнете, за да изберете файл

Как се използва

  1. Пуснете своя PDF файл.
  2. Изберете езика на документа от падащото меню.
  3. Tesseract.js зарежда езиковите данни (~10 MB на език, кеширани след първото използване).
  4. OCR работи локално и PDF изходът с възможност за търсене се предлага за изтегляне.

ЧЗВ

Колко точно е OCR?

Tesseract е една от най-добрите OCR машини с отворен код. За чист, модерен текст обикновено е 95-99% точен. Почерк, сканиране с нисък контраст или необичайни шрифтове могат значително да намалят точността.

Защо първото преобразуване отнема известно време?

Първото изпълнение изтегля ~10-15 MB езикови данни. След това се кешира за останалата част от вашата сесия.

Качва ли се моят документ или изображение на сървър?

Не. Преобразуването се изпълнява изцяло във вашия браузър с помощта на WebAssembly и уеб API. Отворете раздела Мрежа в DevTools, докато конвертирате — няма да видите изходящ трафик, пренасящ вашия файл.

Това наистина ли е безплатно?

Да. Без регистрация, без квота, без надграждане. Преобразуването се изпълнява на вашата машина, така че не ни струва нищо за хостване.