Specijalizirani pretvarač · radi 100% u vašem pregledniku
PDF u pretraživi PDF OCR
Dodajte nevidljivi OCR tekstualni sloj skeniranom PDF-u tako da ga je moguće pretraživati + indeksirati, a pritom zadržati izvorne slike stranice. Svaka stranica se renderira, OCR-uje i ponovno gradi s tekstom položenim preko slike na točnim koordinatama. Izlaz je standardni PDF koji se otvara u bilo kojem čitaču.
Kako koristiti
- Ispustite svoju PDF datoteku.
- Odaberite jezik dokumenta s padajućeg izbornika.
- Tesseract.js učitava jezične podatke (~10 MB po jeziku, predmemorirano nakon prve upotrebe).
- OCR radi lokalno, a pretraživi PDF izlaz se nudi za preuzimanje.
FAQ
Koliko je precizan OCR?
Tesseract je jedan od najboljih open-source OCR motora. Za čist, moderan tekst obično je 95-99% točan. Rukopis, skeniranje niskog kontrasta ili neuobičajeni fontovi mogu znatno smanjiti točnost.
Zašto prva konverzija traje neko vrijeme?
Prvo pokretanje preuzima ~10-15 MB podataka o jeziku. Nakon toga se pohranjuje u predmemoriju do kraja vaše sesije.
Prenosi li se moj dokument ili slika na poslužitelj?
Ne. Konverzija se u potpunosti izvodi u vašem pregledniku pomoću WebAssembly i Web API-ja. Otvorite karticu Mreža u DevTools dok pretvarate — nećete vidjeti izlazni promet koji prenosi vašu datoteku.
Je li ovo stvarno besplatno?
Da. Nema prijave, nema kvote, nema razine nadogradnje. Konverzija se izvodi na vašem računalu, tako da nas hosting ne košta ništa.