Specializovaný převodník · běží 100% ve vašem prohlížeči
PDF do TXT OCR
Extrahujte text z naskenovaného nebo obrazového PDF pomocí OCR (Tesseract.js + pdf.js). Každá stránka je vykreslena na plátno a OCR. Funguje pro dokumenty, kde text nelze vybrat. Během převodu se zobrazuje postup na více stránkách.
Jak používat
- Pusťte svůj soubor PDF.
- Vyberte jazyk dokumentu z rozbalovací nabídky.
- Tesseract.js načte jazyková data (~10 MB na jazyk, uloženo do mezipaměti po prvním použití).
- OCR běží lokálně a výstup TXT je nabízen ke stažení.
Nejčastější dotazy
Jak přesné je OCR?
Tesseract je jedním z nejlepších open source OCR enginů. U čistého, moderního textu je to obvykle 95–99 % přesnost. Rukopis, skenování s nízkým kontrastem nebo neobvyklá písma mohou výrazně snížit přesnost.
Proč první konverze chvíli trvá?
První spuštění stáhne ~10–15 MB jazykových dat. Poté se uloží do mezipaměti pro zbytek vaší relace.
Nahrává se můj dokument nebo obrázek na server?
Ne. Konverze probíhá výhradně ve vašem prohlížeči pomocí WebAssembly a Web API. Během převodu otevřete kartu Síť v nástroji DevTools – neuvidíte žádný odchozí provoz nesoucí váš soubor.
Je to opravdu zdarma?
Ano. Žádná registrace, žádná kvóta, žádná úroveň upgradu. Konverze běží na vašem počítači, takže hostování nás nic nestojí.