Convertidor especializado · se ejecuta al 100% en tu navegador

PDF a PDF con capacidad de búsqueda OCR

Agregue una capa de texto OCR invisible a un PDF escaneado para que se pueda buscar e indexar manteniendo las imágenes de la página original. Cada página se renderiza, se somete a OCR y se reconstruye con el texto colocado sobre la imagen en las coordenadas correctas. El resultado es un PDF estándar que se abre en cualquier lector.

Sin cargaSin registroSin seguimientoGratis, ilimitado
Suelta tu archivo PDF aquí
o haga clic para elegir un archivo

Cómo utilizar

  1. Suelta tu archivo PDF.
  2. Elija el idioma del documento en el menú desplegable.
  3. Tesseract.js carga los datos del idioma (~10 MB por idioma, almacenados en caché después del primer uso).
  4. OCR se ejecuta localmente y el resultado PDF con capacidad de búsqueda se ofrece para descargar.

Preguntas frecuentes

¿Qué tan preciso es el OCR?

Tesseract es uno de los mejores motores de OCR de código abierto. Para textos limpios y modernos, suele tener una precisión del 95-99%. La escritura a mano, los escaneos de bajo contraste o las fuentes inusuales pueden reducir significativamente la precisión.

¿Por qué la primera conversión tarda un poco?

La primera ejecución descarga entre 10 y 15 MB de datos de idioma. Después de eso, se almacena en caché durante el resto de la sesión.

¿Mi documento o imagen se carga en un servidor?

No. La conversión se ejecuta completamente en su navegador mediante WebAssembly y Web API. Abra la pestaña Red en DevTools mientras realiza la conversión; no verá ningún tráfico saliente que lleve su archivo.

¿Es esto realmente gratis?

Sí. Sin registro, sin cuota, sin nivel de actualización. La conversión se ejecuta en su máquina, por lo que no nos cuesta nada alojarla.