Spezialisierter Konverter · läuft zu 100 % in Ihrem Browser
PDF zu durchsuchbarem PDF OCR
Fügen Sie einer gescannten PDF-Datei eine unsichtbare OCR-Textebene hinzu, damit sie durchsuchbar und indexierbar wird, während die Originalseitenbilder erhalten bleiben. Jede Seite wird gerendert, OCR-bearbeitet und neu aufgebaut, wobei der Text an den richtigen Koordinaten über das Bild gelegt wird. Die Ausgabe ist eine Standard-PDF-Datei, die in jedem Reader geöffnet werden kann.
Verwendung
- Legen Sie Ihre PDF-Datei ab.
- Wählen Sie die Sprache des Dokuments aus der Dropdown-Liste aus.
- Tesseract.js lädt die Sprachdaten (~10 MB pro Sprache, zwischengespeichert nach der ersten Verwendung).
- OCR wird lokal ausgeführt und die durchsuchbare PDF-Ausgabe wird zum Download angeboten.
FAQ
Wie genau ist die OCR?
Tesseract ist eine der besten Open-Source-OCR-Engines. Bei sauberem, modernem Text liegt die Genauigkeit normalerweise bei 95–99 %. Handschriften, kontrastarme Scans oder ungewöhnliche Schriftarten können die Genauigkeit erheblich beeinträchtigen.
Warum dauert die erste Konvertierung eine Weile?
Beim ersten Durchlauf werden ca. 10–15 MB Sprachdaten heruntergeladen. Danach wird es für den Rest Ihrer Sitzung zwischengespeichert.
Wird mein Dokument oder Bild auf einen Server hochgeladen?
Nein. Die Konvertierung erfolgt vollständig in Ihrem Browser mithilfe von WebAssembly und Web-APIs. Öffnen Sie während der Konvertierung die Registerkarte „Netzwerk“ in DevTools – Sie werden keinen ausgehenden Datenverkehr sehen, der Ihre Datei überträgt.
Ist das wirklich kostenlos?
Ja. Keine Anmeldung, kein Kontingent, keine Upgrade-Stufe. Die Konvertierung läuft auf Ihrem Rechner, das Hosten kostet uns also nichts.