Convertor specializat · rulează 100% în browser

PDF în TXT OCR

Extrageți text dintr-un PDF scanat sau bazat pe imagini folosind OCR (Tesseract.js + pdf.js). Fiecare pagină este redată pe o pânză și OCR. Funcționează pentru documente în care textul nu este selectabil. Progresul pe mai multe pagini este afișat pe măsură ce conversia se execută.

Nicio încărcareNicio înregistrareFără urmărireGratuit, nelimitat
Aruncă fișierul PDF aici
sau faceți clic pentru a alege un fișier

Cum se utilizează

  1. Aruncă fișierul PDF.
  2. Alegeți limba documentului din meniul derulant.
  3. Tesseract.js încarcă datele de limbă (~10 MB per limbă, stocate în cache după prima utilizare).
  4. OCR rulează local și ieșirea TXT este oferită pentru descărcare.

Întrebări frecvente

Cât de precis este OCR?

Tesseract este unul dintre cele mai bune motoare OCR open-source. Pentru un text curat și modern, este de obicei 95-99% precis. Scrierea de mână, scanările cu contrast redus sau fonturile neobișnuite pot scădea semnificativ acuratețea.

De ce durează prima conversie?

Prima rulare descarcă ~10-15 MB de date de limbă. După aceea, este stocat în cache pentru restul sesiunii.

Documentul sau imaginea mea se încarcă pe un server?

Nu. Conversia rulează în întregime în browser-ul dvs. utilizând WebAssembly și Web API. Deschideți fila Rețea în DevTools în timp ce faceți conversia - nu veți vedea niciun trafic de ieșire care transportă fișierul dvs.

Este cu adevărat gratuit?

Da. Fără înscriere, fără cotă, fără nivel de upgrade. Conversia rulează pe computerul dvs., așa că nu ne costă nimic să găzduim.