Specializovaný převodník · běží 100% ve vašem prohlížeči

PDF do TXT OCR

Extrahujte text z naskenovaného nebo obrazového PDF pomocí OCR (Tesseract.js + pdf.js). Každá stránka je vykreslena na plátno a OCR. Funguje pro dokumenty, kde text nelze vybrat. Během převodu se zobrazuje postup na více stránkách.

Žádné nahráváníŽádná registraceŽádné sledováníZdarma, neomezeně
Přetáhněte soubor PDF sem
nebo kliknutím vyberte soubor

Jak používat

  1. Pusťte svůj soubor PDF.
  2. Vyberte jazyk dokumentu z rozbalovací nabídky.
  3. Tesseract.js načte jazyková data (~10 MB na jazyk, uloženo do mezipaměti po prvním použití).
  4. OCR běží lokálně a výstup TXT je nabízen ke stažení.

Nejčastější dotazy

Jak přesné je OCR?

Tesseract je jedním z nejlepších open source OCR enginů. U čistého, moderního textu je to obvykle 95–99 % přesnost. Rukopis, skenování s nízkým kontrastem nebo neobvyklá písma mohou výrazně snížit přesnost.

Proč první konverze chvíli trvá?

První spuštění stáhne ~10–15 MB jazykových dat. Poté se uloží do mezipaměti pro zbytek vaší relace.

Nahrává se můj dokument nebo obrázek na server?

Ne. Konverze probíhá výhradně ve vašem prohlížeči pomocí WebAssembly a Web API. Během převodu otevřete kartu Síť v nástroji DevTools – neuvidíte žádný odchozí provoz nesoucí váš soubor.

Je to opravdu zdarma?

Ano. Žádná registrace, žádná kvóta, žádná úroveň upgradu. Konverze běží na vašem počítači, takže hostování nás nic nestojí.