Convertidor especialitzat · s'executa al 100% al vostre navegador
PDF a PDF cercable OCR
Afegiu una capa de text OCR invisible a un PDF escanejat perquè es pugui cercar + indexable tot conservant les imatges de la pàgina original. Cada pàgina es representa, es fa OCR i es reconstrueix amb el text posat sobre la imatge a les coordenades correctes. La sortida és un PDF estàndard que s'obre en qualsevol lector.
Com utilitzar
- Deixeu anar el vostre fitxer PDF.
- Trieu l'idioma del document al menú desplegable.
- Tesseract.js carrega les dades de l'idioma (~10 MB per idioma, a la memòria cau després del primer ús).
- OCR s'executa localment i la sortida PDF cercable s'ofereix per descarregar.
PMF
Quina és la precisió de l'OCR?
Tesseract és un dels millors motors OCR de codi obert. Per a un text net i modern, normalment té una precisió del 95-99%. L'escriptura a mà, els escanejos de baix contrast o els tipus de lletra inusuals poden disminuir significativament la precisió.
Per què la primera conversió triga una estona?
La primera execució baixa entre 10 i 15 MB de dades d'idioma. Després d'això, s'emmagatzema a la memòria cau durant la resta de la sessió.
El meu document o imatge es penja a un servidor?
No. La conversió s'executa completament al vostre navegador mitjançant WebAssembly i les API web. Obriu la pestanya Xarxa a DevTools mentre feu la conversió; no veureu trànsit de sortida que porti el vostre fitxer.
És realment gratuït?
Sí. Sense registre, sense quota, sense nivell d'actualització. La conversió s'executa a la vostra màquina, de manera que no ens costa res d'allotjar-la.