Specializirani pretvornik · deluje 100 % v vašem brskalniku
PDF v TXT OCR
Ekstrahirajte besedilo iz skeniranega ali slikovnega PDF-ja z OCR (Tesseract.js + pdf.js). Vsaka stran je upodobljena na platno in OCR. Deluje za dokumente, kjer besedila ni mogoče izbrati. Med potekom pretvorbe je prikazan napredek na več straneh.
Kako uporabljati
- Spustite svojo datoteko PDF.
- V spustnem meniju izberite jezik dokumenta.
- Tesseract.js naloži jezikovne podatke (~10 MB na jezik, predpomnjeno po prvi uporabi).
- OCR deluje lokalno in izhod TXT je na voljo za prenos.
Pogosta vprašanja
Kako natančen je OCR?
Tesseract je eden najboljših odprtokodnih motorjev OCR. Za čisto, sodobno besedilo je običajno 95–99 % natančno. Rokopis, skeniranje z nizkim kontrastom ali nenavadne pisave lahko znatno zmanjšajo natančnost.
Zakaj prva pretvorba traja nekaj časa?
Prvi zagon prenese ~10-15 MB jezikovnih podatkov. Po tem se shrani v predpomnilnik za preostanek vaše seje.
Ali se moj dokument ali slika naloži na strežnik?
Ne. Pretvorba se v celoti izvaja v vašem brskalniku z uporabo WebAssembly in spletnih API-jev. Med pretvorbo odprite zavihek Omrežje v Orodjih za razvijalce – ne boste videli nobenega odhodnega prometa, ki prenaša vašo datoteko.
Je to res brezplačno?
Da. Brez prijave, brez kvote, brez stopnje nadgradnje. Pretvorba poteka na vašem računalniku, zato nas gostovanje ne stane nič.