Spezialisierter Konverter · läuft zu 100 % in deinem Browser
PDF zu TXT OCR
Text aus einem gescannten oder bildbasierten PDF mittels OCR (Tesseract.js + pdf.js) extrahieren. Jede Seite wird auf einem Canvas gerendert und per OCR verarbeitet. Funktioniert für Dokumente, in denen der Text nicht auswählbar ist. Der mehrseitige Fortschritt wird während der Konvertierung angezeigt.
So wird's gemacht
- PDF-Datei ablegen.
- Die Sprache des Dokuments aus dem Dropdown auswählen.
- Tesseract.js lädt die Sprachdaten (~10 MB pro Sprache, nach der ersten Verwendung gecacht).
- OCR läuft lokal und die TXT-Ausgabe wird zum Download angeboten.
FAQ
Wie genau ist die OCR?
Tesseract ist eine der besten Open-Source-OCR-Engines. Für klaren, modernen Text ist sie in der Regel 95–99 % genau. Handschrift, kontrastarme Scans oder ungewöhnliche Schriftarten können die Genauigkeit deutlich verringern.
Warum dauert die erste Konvertierung länger?
Der erste Durchlauf lädt ~10–15 MB Sprachdaten herunter. Danach werden diese für den Rest Ihrer Sitzung gecacht.
Wird mein Dokument oder Bild auf einen Server hochgeladen?
Nein. Die Konvertierung läuft vollständig in deinem Browser über WebAssembly und Web-APIs. Öffne den Network-Tab in den DevTools während der Konvertierung — du wirst keinen ausgehenden Traffic sehen, der deine Datei überträgt.
Ist das wirklich kostenlos?
Ja. Keine Anmeldung, kein Kontingent, keine Upgrade-Stufe. Die Konvertierung läuft auf deinem Gerät, daher entstehen uns keine Hosting-Kosten.