Specializovaný převodník · běží 100% ve vašem prohlížeči

PDF do prohledávatelného PDF OCR

Přidejte do naskenovaného PDF neviditelnou textovou vrstvu OCR, aby bylo možné jej prohledávat + indexovat a přitom zachovat původní obrázky stránek. Každá stránka je vykreslena, OCR'd a přestavěna s textem položeným přes obrázek na správných souřadnicích. Výstupem je standardní PDF, které se otevře v libovolné čtečce.

Žádné nahráváníŽádná registraceŽádné sledováníZdarma, neomezeně
Přetáhněte soubor PDF sem
nebo kliknutím vyberte soubor

Jak používat

  1. Pusťte svůj soubor PDF.
  2. Vyberte jazyk dokumentu z rozbalovací nabídky.
  3. Tesseract.js načte jazyková data (~10 MB na jazyk, uloženo do mezipaměti po prvním použití).
  4. OCR běží lokálně a výstup PDF s možností vyhledávání je nabízen ke stažení. Převodník

Nejčastější dotazy

Jak přesné je OCR?

Tesseract je jedním z nejlepších open source OCR enginů. U čistého, moderního textu je to obvykle 95–99 % přesnost. Rukopis, skenování s nízkým kontrastem nebo neobvyklá písma mohou výrazně snížit přesnost.

Proč první konverze chvíli trvá?

První spuštění stáhne ~10–15 MB jazykových dat. Poté se uloží do mezipaměti pro zbytek vaší relace.

Nahrává se můj dokument nebo obrázek na server?

Ne. Konverze probíhá výhradně ve vašem prohlížeči pomocí WebAssembly a Web API. Během převodu otevřete kartu Síť v nástroji DevTools – neuvidíte žádný odchozí provoz nesoucí váš soubor.

Je to opravdu zdarma?

Ano. Žádná registrace, žádná kvóta, žádná úroveň upgradu. Konverze běží na vašem počítači, takže hostování nás nic nestojí.