Convertitore specializzato · funziona 100% nel tuo browser
OCR da PDF a TXT
Estrai testo da un PDF scansionato o basato su immagini usando OCR (Tesseract.js + pdf.js). Ogni pagina viene renderizzata su un canvas e sottoposta a OCR. Funziona per documenti in cui il testo non è selezionabile. L'avanzamento multi-pagina viene mostrato durante la conversione.
Come si usa
- Trascina il tuo file PDF.
- Scegli la lingua del documento dal menu a discesa.
- Tesseract.js carica i dati della lingua (~10 MB per lingua, in cache dopo il primo utilizzo).
- L'OCR gira localmente e l'output TXT viene messo a disposizione per il download.
FAQ
Quanto è preciso l'OCR?
Tesseract è uno dei migliori motori OCR open-source. Per testi moderni e puliti è tipicamente preciso al 95-99%. Scrittura a mano, scansioni a basso contrasto o font inusuali possono ridurre significativamente la precisione.
Perché la prima conversione richiede un po' di tempo?
La prima esecuzione scarica ~10-15 MB di dati linguistici. Dopodiché vengono messi in cache per il resto della sessione.
Il mio documento o immagine viene caricato su un server?
No. La conversione avviene interamente nel tuo browser tramite WebAssembly e Web API. Apri il pannello Network in DevTools mentre converti — non vedrai traffico in uscita che trasporti il tuo file.
È davvero gratuito?
Sì. Nessuna registrazione, nessuna quota, nessun piano a pagamento. La conversione avviene sul tuo dispositivo, quindi non ha costi di hosting per noi.