Convertidor especialitzat · s'executa al 100% al vostre navegador

PDF a TXT OCR

Extreu text d'un PDF escanejat o basat en imatges mitjançant OCR (Tesseract.js + pdf.js). Cada pàgina es representa a un llenç i es fa OCR. Funciona per a documents on el text no es pot seleccionar. El progrés de diverses pàgines es mostra a mesura que s'executa la conversió.

Sense càrregaSense registreSense seguimentGratuït, il·limitat
Deixeu anar el vostre fitxer PDF aquí
o feu clic per triar un fitxer

Com utilitzar

  1. Deixeu anar el vostre fitxer PDF.
  2. Trieu l'idioma del document al menú desplegable.
  3. Tesseract.js carrega les dades de l'idioma (~10 MB per idioma, a la memòria cau després del primer ús).
  4. OCR s'executa localment i la sortida TXT s'ofereix per descarregar.

PMF

Quina és la precisió de l'OCR?

Tesseract és un dels millors motors OCR de codi obert. Per a un text net i modern, normalment té una precisió del 95-99%. L'escriptura a mà, els escanejos de baix contrast o els tipus de lletra inusuals poden disminuir significativament la precisió.

Per què la primera conversió triga una estona?

La primera execució baixa entre 10 i 15 MB de dades d'idioma. Després d'això, s'emmagatzema a la memòria cau durant la resta de la sessió.

El meu document o imatge es penja a un servidor?

No. La conversió s'executa completament al vostre navegador mitjançant WebAssembly i les API web. Obriu la pestanya Xarxa a DevTools mentre feu la conversió; no veureu trànsit de sortida que porti el vostre fitxer.

És realment gratuït?

Sí. Sense registre, sense quota, sense nivell d'actualització. La conversió s'executa a la vostra màquina, de manera que no ens costa res d'allotjar-la.