Convertidor especialitzat · s'executa al 100% al vostre navegador

PDF a PDF cercable OCR

Afegiu una capa de text OCR invisible a un PDF escanejat perquè es pugui cercar + indexable tot conservant les imatges de la pàgina original. Cada pàgina es representa, es fa OCR i es reconstrueix amb el text posat sobre la imatge a les coordenades correctes. La sortida és un PDF estàndard que s'obre en qualsevol lector.

Sense càrregaSense registreSense seguimentGratuït, il·limitat
Deixeu anar el vostre fitxer PDF aquí
o feu clic per triar un fitxer

Com utilitzar

  1. Deixeu anar el vostre fitxer PDF.
  2. Trieu l'idioma del document al menú desplegable.
  3. Tesseract.js carrega les dades de l'idioma (~10 MB per idioma, a la memòria cau després del primer ús).
  4. OCR s'executa localment i la sortida PDF cercable s'ofereix per descarregar.

PMF

Quina és la precisió de l'OCR?

Tesseract és un dels millors motors OCR de codi obert. Per a un text net i modern, normalment té una precisió del 95-99%. L'escriptura a mà, els escanejos de baix contrast o els tipus de lletra inusuals poden disminuir significativament la precisió.

Per què la primera conversió triga una estona?

La primera execució baixa entre 10 i 15 MB de dades d'idioma. Després d'això, s'emmagatzema a la memòria cau durant la resta de la sessió.

El meu document o imatge es penja a un servidor?

No. La conversió s'executa completament al vostre navegador mitjançant WebAssembly i les API web. Obriu la pestanya Xarxa a DevTools mentre feu la conversió; no veureu trànsit de sortida que porti el vostre fitxer.

És realment gratuït?

Sí. Sense registre, sense quota, sense nivell d'actualització. La conversió s'executa a la vostra màquina, de manera que no ens costa res d'allotjar-la.