Conversor especializado · funciona 100% no seu navegador
PDF para OCR de PDF pesquisável
Adicione uma camada de texto OCR invisível a um PDF digitalizado para que ele se torne pesquisável e indexável, mantendo as imagens da página original. Cada página é renderizada, submetida a OCR e reconstruída com o texto colocado sobre a imagem nas coordenadas corretas. A saída é um PDF padrão que abre em qualquer leitor.
Como usar
- Solte seu arquivo PDF.
- Escolha o idioma do documento no menu suspenso.
- Tesseract.js carrega os dados do idioma (cerca de 10 MB por idioma, armazenados em cache após o primeiro uso).
- OCR é executado localmente e a saída em PDF pesquisável é oferecida para download.
Perguntas frequentes
Quão preciso é o OCR?
Tesseract é um dos melhores mecanismos de OCR de código aberto. Para texto limpo e moderno, normalmente é 95-99% preciso. Caligrafia, digitalizações de baixo contraste ou fontes incomuns podem diminuir significativamente a precisão.
Por que a primeira conversão demora um pouco?
A primeira execução baixa cerca de 10 a 15 MB de dados de idioma. Depois disso, ele será armazenado em cache pelo resto da sessão.
Meu documento ou imagem é carregado em um servidor?
Não. A conversão é executada inteiramente em seu navegador usando WebAssembly e APIs da Web. Abra a guia Rede no DevTools enquanto você converte – você não verá nenhum tráfego de saída transportando seu arquivo.
Isso é realmente grátis?
Sim. Sem inscrição, sem cota, sem nível de atualização. A conversão é executada na sua máquina, portanto não nos custa nada hospedar.