Specializirani pretvornik · deluje 100 % v vašem brskalniku
OCR PDF v PDF po možnosti iskanja
Skeniranemu dokumentu PDF dodajte nevidno besedilno plast OCR, da bo po njem mogoče iskati in ga indeksirati, hkrati pa ohraniti izvirne slike strani. Vsaka stran je upodobljena, OCR-jeva in ponovno zgrajena z besedilom, položenim čez sliko na pravilnih koordinatah. Izhod je standardni PDF, ki se odpre v katerem koli bralniku.
Kako uporabljati
- Spustite svojo datoteko PDF.
- V spustnem meniju izberite jezik dokumenta.
- Tesseract.js naloži jezikovne podatke (~10 MB na jezik, predpomnjeno po prvi uporabi).
- OCR se izvaja lokalno in izhod PDF, po katerem je mogoče iskati, je na voljo za prenos.
Pogosta vprašanja
Kako natančen je OCR?
Tesseract je eden najboljših odprtokodnih motorjev OCR. Za čisto, sodobno besedilo je običajno 95–99 % natančno. Rokopis, skeniranje z nizkim kontrastom ali nenavadne pisave lahko znatno zmanjšajo natančnost.
Zakaj prva pretvorba traja nekaj časa?
Prvi zagon prenese ~10-15 MB jezikovnih podatkov. Po tem se shrani v predpomnilnik za preostanek vaše seje.
Ali se moj dokument ali slika naloži na strežnik?
Ne. Pretvorba se v celoti izvaja v vašem brskalniku z uporabo WebAssembly in spletnih API-jev. Med pretvorbo odprite zavihek Omrežje v Orodjih za razvijalce – ne boste videli nobenega odhodnega prometa, ki prenaša vašo datoteko.
Je to res brezplačno?
Da. Brez prijave, brez kvote, brez stopnje nadgradnje. Pretvorba poteka na vašem računalniku, zato nas gostovanje ne stane nič.