Convertitore specializzato · funziona al 100% nel tuo browser

OCR da PDF a TXT

Estrai testo da un PDF scansionato o basato su immagini utilizzando l'OCR (Tesseract.js + pdf.js). Ogni pagina viene renderizzata su una tela e sottoposta a OCR. Funziona per documenti in cui il testo non è selezionabile. L'avanzamento di più pagine viene mostrato durante l'esecuzione della conversione.

Nessun caricamentoNessuna registrazioneNessun tracciamentoGratuito, illimitato
Trascina qui il tuo file PDF
oppure fai clic per scegliere un file

Come usare

  1. Rilascia il tuo file PDF.
  2. Scegli la lingua del documento dal menu a discesa.
  3. Tesseract.js carica i dati della lingua (~10 MB per lingua, memorizzati nella cache dopo il primo utilizzo).
  4. L'OCR viene eseguito localmente e l'output TXT viene offerto per il download.

Domande frequenti

Quanto è accurato l'OCR?

Tesseract è uno dei migliori motori OCR open source. Per un testo pulito e moderno la precisione è generalmente pari al 95-99%. La scrittura a mano, le scansioni a basso contrasto o i caratteri insoliti possono ridurre significativamente la precisione.

Perché la prima conversione richiede del tempo?

La prima esecuzione scarica circa 10-15 MB di dati sulla lingua. Successivamente viene memorizzato nella cache per il resto della sessione.

Il mio documento o immagine viene caricato su un server?

No. La conversione viene eseguita interamente nel tuo browser utilizzando WebAssembly e API Web. Apri la scheda Rete in DevTools durante la conversione: non vedrai traffico in uscita che trasporta il tuo file.

È davvero gratuito?

Sì. Nessuna registrazione, nessuna quota, nessun livello di aggiornamento. La conversione viene eseguita sul tuo computer, quindi l'hosting non ci costa nulla.