Specjalistyczny konwerter · działa w 100% w Twojej przeglądarce
PDF do TXT OCR
Wyodrębnij tekst z zeskanowanego lub opartego na obrazie pliku PDF za pomocą OCR (Tesseract.js + pdf.js). Każda strona jest renderowana na płótnie i poddawana OCR. Działa w przypadku dokumentów, w których nie można zaznaczyć tekstu. Postęp konwersji na wielu stronach jest pokazywany w miarę trwania konwersji.
Jak używać
- Upuść plik PDF.
- Wybierz język dokumentu z listy rozwijanej.
- Tesseract.js ładuje dane językowe (~10 MB na język, buforowane po pierwszym użyciu).
- OCR działa lokalnie, a wyjście TXT jest oferowane do pobrania.
FAQ
Jak dokładny jest OCR?
Tesseract to jeden z najlepszych silników OCR typu open source. W przypadku czystego, nowoczesnego tekstu jego dokładność wynosi zazwyczaj 95–99%. Pismo odręczne, skany o niskim kontraście lub nietypowe czcionki mogą znacznie obniżyć dokładność.
Dlaczego pierwsza konwersja zajmuje trochę czasu?
Pierwsze uruchomienie powoduje pobranie ~10-15 MB danych językowych. Następnie jest buforowany do końca sesji.
Czy mój dokument lub obraz został przesłany na serwer?
Nie. Konwersja odbywa się całkowicie w przeglądarce przy użyciu zestawu WebAssembly i interfejsów API sieci Web. Otwórz kartę Sieć w DevTools podczas konwersji — nie zobaczysz żadnego ruchu wychodzącego przenoszącego Twój plik.
Czy to naprawdę jest darmowe?
Tak. Bez rejestracji, bez limitu, bez poziomu uaktualnienia. Konwersja przebiega na Twoim komputerze, więc hosting nie kosztuje nas nic.