Specializirani pretvornik · deluje 100 % v vašem brskalniku

PDF v TXT OCR

Ekstrahirajte besedilo iz skeniranega ali slikovnega PDF-ja z OCR (Tesseract.js + pdf.js). Vsaka stran je upodobljena na platno in OCR. Deluje za dokumente, kjer besedila ni mogoče izbrati. Med potekom pretvorbe je prikazan napredek na več straneh.

Brez nalaganjaBrez prijaveBrez sledenjaBrezplačno, neomejeno
Svojo datoteko PDF spustite sem
ali kliknite, da izberete datoteko

Kako uporabljati

  1. Spustite svojo datoteko PDF.
  2. V spustnem meniju izberite jezik dokumenta.
  3. Tesseract.js naloži jezikovne podatke (~10 MB na jezik, predpomnjeno po prvi uporabi).
  4. OCR deluje lokalno in izhod TXT je na voljo za prenos.

Pogosta vprašanja

Kako natančen je OCR?

Tesseract je eden najboljših odprtokodnih motorjev OCR. Za čisto, sodobno besedilo je običajno 95–99 % natančno. Rokopis, skeniranje z nizkim kontrastom ali nenavadne pisave lahko znatno zmanjšajo natančnost.

Zakaj prva pretvorba traja nekaj časa?

Prvi zagon prenese ~10-15 MB jezikovnih podatkov. Po tem se shrani v predpomnilnik za preostanek vaše seje.

Ali se moj dokument ali slika naloži na strežnik?

Ne. Pretvorba se v celoti izvaja v vašem brskalniku z uporabo WebAssembly in spletnih API-jev. Med pretvorbo odprite zavihek Omrežje v Orodjih za razvijalce – ne boste videli nobenega odhodnega prometa, ki prenaša vašo datoteko.

Je to res brezplačno?

Da. Brez prijave, brez kvote, brez stopnje nadgradnje. Pretvorba poteka na vašem računalniku, zato nas gostovanje ne stane nič.