Conversor especializado · funciona 100 % en tu navegador
OCR de PDF a PDF con texto buscable
Añade una capa de texto OCR invisible a un PDF escaneado para que se pueda buscar e indexar conservando las imágenes originales de las páginas. Cada página se renderiza, se procesa con OCR y se reconstruye con el texto superpuesto sobre la imagen en las coordenadas correctas. La salida es un PDF estándar que se abre en cualquier lector.
Cómo se usa
- Suelta tu archivo PDF.
- Elige el idioma del documento en el menú desplegable.
- Tesseract.js carga los datos del idioma (~10 MB por idioma, en caché tras el primer uso).
- El OCR se ejecuta localmente y se ofrece para descargar el PDF con texto buscable.
Preguntas frecuentes
¿Qué precisión tiene el OCR?
Tesseract es uno de los mejores motores de OCR de código abierto. Con texto limpio y moderno suele tener entre un 95 % y un 99 % de precisión. La escritura a mano, los escaneos de bajo contraste o las fuentes poco habituales pueden reducir bastante la precisión.
¿Por qué tarda un poco la primera conversión?
La primera ejecución descarga entre 10 y 15 MB de datos del idioma. Después queda en caché durante el resto de tu sesión.
¿Se suben mi documento o mi imagen a un servidor?
No. La conversión se ejecuta por completo en tu navegador mediante WebAssembly y las API web. Abre la pestaña Red en DevTools mientras conviertes: no verás ningún tráfico saliente que lleve tu archivo.
¿Esto es realmente gratis?
Sí. Sin registro, sin cuota, sin nivel de pago. La conversión se ejecuta en tu equipo, así que alojarla no nos cuesta nada.