Specijalizirani pretvarač · radi 100% u vašem pregledniku
PDF u TXT OCR
Izdvojite tekst iz skeniranog PDF-a ili PDF-a temeljenog na slici pomoću OCR-a (Tesseract.js + pdf.js). Svaka se stranica prikazuje na platnu i OCR-u. Radi za dokumente u kojima se tekst ne može odabrati. Napredak na više stranica prikazuje se tijekom pretvorbe.
Kako koristiti
- Ispustite svoju PDF datoteku.
- Odaberite jezik dokumenta s padajućeg izbornika.
- Tesseract.js učitava jezične podatke (~10 MB po jeziku, predmemorirano nakon prve upotrebe).
- OCR radi lokalno, a TXT izlaz se nudi za preuzimanje.
FAQ
Koliko je precizan OCR?
Tesseract je jedan od najboljih open-source OCR motora. Za čist, moderan tekst obično je 95-99% točan. Rukopis, skeniranje niskog kontrasta ili neuobičajeni fontovi mogu znatno smanjiti točnost.
Zašto prva konverzija traje neko vrijeme?
Prvo pokretanje preuzima ~10-15 MB podataka o jeziku. Nakon toga se pohranjuje u predmemoriju do kraja vaše sesije.
Prenosi li se moj dokument ili slika na poslužitelj?
Ne. Konverzija se u potpunosti izvodi u vašem pregledniku pomoću WebAssembly i Web API-ja. Otvorite karticu Mreža u DevTools dok pretvarate — nećete vidjeti izlazni promet koji prenosi vašu datoteku.
Je li ovo stvarno besplatno?
Da. Nema prijave, nema kvote, nema razine nadogradnje. Konverzija se izvodi na vašem računalu, tako da nas hosting ne košta ništa.