Convertor specializat · rulează 100% în browser
PDF în TXT OCR
Extrageți text dintr-un PDF scanat sau bazat pe imagini folosind OCR (Tesseract.js + pdf.js). Fiecare pagină este redată pe o pânză și OCR. Funcționează pentru documente în care textul nu este selectabil. Progresul pe mai multe pagini este afișat pe măsură ce conversia se execută.
Cum se utilizează
- Aruncă fișierul PDF.
- Alegeți limba documentului din meniul derulant.
- Tesseract.js încarcă datele de limbă (~10 MB per limbă, stocate în cache după prima utilizare).
- OCR rulează local și ieșirea TXT este oferită pentru descărcare.
Întrebări frecvente
Cât de precis este OCR?
Tesseract este unul dintre cele mai bune motoare OCR open-source. Pentru un text curat și modern, este de obicei 95-99% precis. Scrierea de mână, scanările cu contrast redus sau fonturile neobișnuite pot scădea semnificativ acuratețea.
De ce durează prima conversie?
Prima rulare descarcă ~10-15 MB de date de limbă. După aceea, este stocat în cache pentru restul sesiunii.
Documentul sau imaginea mea se încarcă pe un server?
Nu. Conversia rulează în întregime în browser-ul dvs. utilizând WebAssembly și Web API. Deschideți fila Rețea în DevTools în timp ce faceți conversia - nu veți vedea niciun trafic de ieșire care transportă fișierul dvs.
Este cu adevărat gratuit?
Da. Fără înscriere, fără cotă, fără nivel de upgrade. Conversia rulează pe computerul dvs., așa că nu ne costă nimic să găzduim.