Convertidor especialitzat · s'executa al 100% al vostre navegador
PDF a TXT OCR
Extreu text d'un PDF escanejat o basat en imatges mitjançant OCR (Tesseract.js + pdf.js). Cada pàgina es representa a un llenç i es fa OCR. Funciona per a documents on el text no es pot seleccionar. El progrés de diverses pàgines es mostra a mesura que s'executa la conversió.
Com utilitzar
- Deixeu anar el vostre fitxer PDF.
- Trieu l'idioma del document al menú desplegable.
- Tesseract.js carrega les dades de l'idioma (~10 MB per idioma, a la memòria cau després del primer ús).
- OCR s'executa localment i la sortida TXT s'ofereix per descarregar.
PMF
Quina és la precisió de l'OCR?
Tesseract és un dels millors motors OCR de codi obert. Per a un text net i modern, normalment té una precisió del 95-99%. L'escriptura a mà, els escanejos de baix contrast o els tipus de lletra inusuals poden disminuir significativament la precisió.
Per què la primera conversió triga una estona?
La primera execució baixa entre 10 i 15 MB de dades d'idioma. Després d'això, s'emmagatzema a la memòria cau durant la resta de la sessió.
El meu document o imatge es penja a un servidor?
No. La conversió s'executa completament al vostre navegador mitjançant WebAssembly i les API web. Obriu la pestanya Xarxa a DevTools mentre feu la conversió; no veureu trànsit de sortida que porti el vostre fitxer.
És realment gratuït?
Sí. Sense registre, sense quota, sense nivell d'actualització. La conversió s'executa a la vostra màquina, de manera que no ens costa res d'allotjar-la.