Specializovaný převodník · běží 100% ve vašem prohlížeči
PDF do prohledávatelného PDF OCR
Přidejte do naskenovaného PDF neviditelnou textovou vrstvu OCR, aby bylo možné jej prohledávat + indexovat a přitom zachovat původní obrázky stránek. Každá stránka je vykreslena, OCR'd a přestavěna s textem položeným přes obrázek na správných souřadnicích. Výstupem je standardní PDF, které se otevře v libovolné čtečce.
Jak používat
- Pusťte svůj soubor PDF.
- Vyberte jazyk dokumentu z rozbalovací nabídky.
- Tesseract.js načte jazyková data (~10 MB na jazyk, uloženo do mezipaměti po prvním použití).
- OCR běží lokálně a výstup PDF s možností vyhledávání je nabízen ke stažení. Převodník
Nejčastější dotazy
Jak přesné je OCR?
Tesseract je jedním z nejlepších open source OCR enginů. U čistého, moderního textu je to obvykle 95–99 % přesnost. Rukopis, skenování s nízkým kontrastem nebo neobvyklá písma mohou výrazně snížit přesnost.
Proč první konverze chvíli trvá?
První spuštění stáhne ~10–15 MB jazykových dat. Poté se uloží do mezipaměti pro zbytek vaší relace.
Nahrává se můj dokument nebo obrázek na server?
Ne. Konverze probíhá výhradně ve vašem prohlížeči pomocí WebAssembly a Web API. Během převodu otevřete kartu Síť v nástroji DevTools – neuvidíte žádný odchozí provoz nesoucí váš soubor.
Je to opravdu zdarma?
Ano. Žádná registrace, žádná kvóta, žádná úroveň upgradu. Konverze běží na vašem počítači, takže hostování nás nic nestojí.