Специализиран конвертор · работи 100% във вашия браузър
PDF към PDF с възможност за търсене OCR
Добавете невидим текстов слой за OCR към сканиран PDF файл, така че да може да се търси + да се индексира, като същевременно запазите оригиналните изображения на страницата. Всяка страница се изобразява, разпознава и възстановява с текст, положен върху изображението в правилните координати. Изходът е стандартен PDF, който се отваря във всеки четец.
Как се използва
- Пуснете своя PDF файл.
- Изберете езика на документа от падащото меню.
- Tesseract.js зарежда езиковите данни (~10 MB на език, кеширани след първото използване).
- OCR работи локално и PDF изходът с възможност за търсене се предлага за изтегляне.
ЧЗВ
Колко точно е OCR?
Tesseract е една от най-добрите OCR машини с отворен код. За чист, модерен текст обикновено е 95-99% точен. Почерк, сканиране с нисък контраст или необичайни шрифтове могат значително да намалят точността.
Защо първото преобразуване отнема известно време?
Първото изпълнение изтегля ~10-15 MB езикови данни. След това се кешира за останалата част от вашата сесия.
Качва ли се моят документ или изображение на сървър?
Не. Преобразуването се изпълнява изцяло във вашия браузър с помощта на WebAssembly и уеб API. Отворете раздела Мрежа в DevTools, докато конвертирате — няма да видите изходящ трафик, пренасящ вашия файл.
Това наистина ли е безплатно?
Да. Без регистрация, без квота, без надграждане. Преобразуването се изпълнява на вашата машина, така че не ни струва нищо за хостване.