Convertitore specializzato · funziona 100% nel tuo browser

OCR da PDF a TXT

Estrai testo da un PDF scansionato o basato su immagini usando OCR (Tesseract.js + pdf.js). Ogni pagina viene renderizzata su un canvas e sottoposta a OCR. Funziona per documenti in cui il testo non è selezionabile. L'avanzamento multi-pagina viene mostrato durante la conversione.

Nessun caricamentoNessuna registrazioneNessun tracciamentoGratuito, illimitato
Trascina qui il tuo file PDF
o clicca per scegliere un file

Come si usa

  1. Trascina il tuo file PDF.
  2. Scegli la lingua del documento dal menu a discesa.
  3. Tesseract.js carica i dati della lingua (~10 MB per lingua, in cache dopo il primo utilizzo).
  4. L'OCR gira localmente e l'output TXT viene messo a disposizione per il download.

FAQ

Quanto è preciso l'OCR?

Tesseract è uno dei migliori motori OCR open-source. Per testi moderni e puliti è tipicamente preciso al 95-99%. Scrittura a mano, scansioni a basso contrasto o font inusuali possono ridurre significativamente la precisione.

Perché la prima conversione richiede un po' di tempo?

La prima esecuzione scarica ~10-15 MB di dati linguistici. Dopodiché vengono messi in cache per il resto della sessione.

Il mio documento o immagine viene caricato su un server?

No. La conversione avviene interamente nel tuo browser tramite WebAssembly e Web API. Apri il pannello Network in DevTools mentre converti — non vedrai traffico in uscita che trasporti il tuo file.

È davvero gratuito?

Sì. Nessuna registrazione, nessuna quota, nessun piano a pagamento. La conversione avviene sul tuo dispositivo, quindi non ha costi di hosting per noi.