Conversor especializado · funciona 100% no seu navegador

PDF para TXT OCR

Extraia texto de um PDF digitalizado ou baseado em imagem usando OCR (Tesseract.js + pdf.js). Cada página é renderizada em uma tela e submetida a OCR. Funciona para documentos onde o texto não é selecionável. O progresso de várias páginas é mostrado à medida que a conversão é executada.

Sem uploadSem inscriçãoSem rastreamentoGrátis, ilimitado
Solte seu arquivo PDF aqui
ou clique para escolher um arquivo

Como usar

  1. Solte seu arquivo PDF.
  2. Escolha o idioma do documento no menu suspenso.
  3. Tesseract.js carrega os dados do idioma (cerca de 10 MB por idioma, armazenados em cache após o primeiro uso).
  4. OCR é executado localmente e a saída TXT é oferecida para download.

Perguntas frequentes

Quão preciso é o OCR?

Tesseract é um dos melhores mecanismos de OCR de código aberto. Para texto limpo e moderno, normalmente é 95-99% preciso. Caligrafia, digitalizações de baixo contraste ou fontes incomuns podem diminuir significativamente a precisão.

Por que a primeira conversão demora um pouco?

A primeira execução baixa cerca de 10 a 15 MB de dados de idioma. Depois disso, ele será armazenado em cache pelo resto da sessão.

Meu documento ou imagem é carregado em um servidor?

Não. A conversão é executada inteiramente em seu navegador usando WebAssembly e APIs da Web. Abra a guia Rede no DevTools enquanto você converte – você não verá nenhum tráfego de saída transportando seu arquivo.

Isso é realmente grátis?

Sim. Sem inscrição, sem cota, sem nível de atualização. A conversão é executada na sua máquina, portanto não nos custa nada hospedar.