Specjalistyczny konwerter · działa w 100% w Twojej przeglądarce

PDF do TXT OCR

Wyodrębnij tekst z zeskanowanego lub opartego na obrazie pliku PDF za pomocą OCR (Tesseract.js + pdf.js). Każda strona jest renderowana na płótnie i poddawana OCR. Działa w przypadku dokumentów, w których nie można zaznaczyć tekstu. Postęp konwersji na wielu stronach jest pokazywany w miarę trwania konwersji.

Brak przesyłaniaBrak rejestracjiBrak śledzeniaBezpłatnie, bez ograniczeń
Upuść tutaj swój plik PDF
lub kliknij, aby wybrać plik

Jak używać

  1. Upuść plik PDF.
  2. Wybierz język dokumentu z listy rozwijanej.
  3. Tesseract.js ładuje dane językowe (~10 MB na język, buforowane po pierwszym użyciu).
  4. OCR działa lokalnie, a wyjście TXT jest oferowane do pobrania.

FAQ

Jak dokładny jest OCR?

Tesseract to jeden z najlepszych silników OCR typu open source. W przypadku czystego, nowoczesnego tekstu jego dokładność wynosi zazwyczaj 95–99%. Pismo odręczne, skany o niskim kontraście lub nietypowe czcionki mogą znacznie obniżyć dokładność.

Dlaczego pierwsza konwersja zajmuje trochę czasu?

Pierwsze uruchomienie powoduje pobranie ~10-15 MB danych językowych. Następnie jest buforowany do końca sesji.

Czy mój dokument lub obraz został przesłany na serwer?

Nie. Konwersja odbywa się całkowicie w przeglądarce przy użyciu zestawu WebAssembly i interfejsów API sieci Web. Otwórz kartę Sieć w DevTools podczas konwersji — nie zobaczysz żadnego ruchu wychodzącego przenoszącego Twój plik.

Czy to naprawdę jest darmowe?

Tak. Bez rejestracji, bez limitu, bez poziomu uaktualnienia. Konwersja przebiega na Twoim komputerze, więc hosting nie kosztuje nas nic.