Convertitore specializzato · funziona al 100% nel tuo browser
OCR da PDF a TXT
Estrai testo da un PDF scansionato o basato su immagini utilizzando l'OCR (Tesseract.js + pdf.js). Ogni pagina viene renderizzata su una tela e sottoposta a OCR. Funziona per documenti in cui il testo non è selezionabile. L'avanzamento di più pagine viene mostrato durante l'esecuzione della conversione.
Come usare
- Rilascia il tuo file PDF.
- Scegli la lingua del documento dal menu a discesa.
- Tesseract.js carica i dati della lingua (~10 MB per lingua, memorizzati nella cache dopo il primo utilizzo).
- L'OCR viene eseguito localmente e l'output TXT viene offerto per il download.
Domande frequenti
Quanto è accurato l'OCR?
Tesseract è uno dei migliori motori OCR open source. Per un testo pulito e moderno la precisione è generalmente pari al 95-99%. La scrittura a mano, le scansioni a basso contrasto o i caratteri insoliti possono ridurre significativamente la precisione.
Perché la prima conversione richiede del tempo?
La prima esecuzione scarica circa 10-15 MB di dati sulla lingua. Successivamente viene memorizzato nella cache per il resto della sessione.
Il mio documento o immagine viene caricato su un server?
No. La conversione viene eseguita interamente nel tuo browser utilizzando WebAssembly e API Web. Apri la scheda Rete in DevTools durante la conversione: non vedrai traffico in uscita che trasporta il tuo file.
È davvero gratuito?
Sì. Nessuna registrazione, nessuna quota, nessun livello di aggiornamento. La conversione viene eseguita sul tuo computer, quindi l'hosting non ci costa nulla.