Spezialisierter Konverter · läuft zu 100 % in Ihrem Browser

PDF zu durchsuchbarem PDF OCR

Fügen Sie einer gescannten PDF-Datei eine unsichtbare OCR-Textebene hinzu, damit sie durchsuchbar und indexierbar wird, während die Originalseitenbilder erhalten bleiben. Jede Seite wird gerendert, OCR-bearbeitet und neu aufgebaut, wobei der Text an den richtigen Koordinaten über das Bild gelegt wird. Die Ausgabe ist eine Standard-PDF-Datei, die in jedem Reader geöffnet werden kann.

Kein UploadKeine AnmeldungKeine NachverfolgungKostenlos, unbegrenzt
Legen Sie Ihre PDF-Datei hier ab
oder klicken Sie, um eine Datei auszuwählen

Verwendung

  1. Legen Sie Ihre PDF-Datei ab.
  2. Wählen Sie die Sprache des Dokuments aus der Dropdown-Liste aus.
  3. Tesseract.js lädt die Sprachdaten (~10 MB pro Sprache, zwischengespeichert nach der ersten Verwendung).
  4. OCR wird lokal ausgeführt und die durchsuchbare PDF-Ausgabe wird zum Download angeboten.

FAQ

Wie genau ist die OCR?

Tesseract ist eine der besten Open-Source-OCR-Engines. Bei sauberem, modernem Text liegt die Genauigkeit normalerweise bei 95–99 %. Handschriften, kontrastarme Scans oder ungewöhnliche Schriftarten können die Genauigkeit erheblich beeinträchtigen.

Warum dauert die erste Konvertierung eine Weile?

Beim ersten Durchlauf werden ca. 10–15 MB Sprachdaten heruntergeladen. Danach wird es für den Rest Ihrer Sitzung zwischengespeichert.

Wird mein Dokument oder Bild auf einen Server hochgeladen?

Nein. Die Konvertierung erfolgt vollständig in Ihrem Browser mithilfe von WebAssembly und Web-APIs. Öffnen Sie während der Konvertierung die Registerkarte „Netzwerk“ in DevTools – Sie werden keinen ausgehenden Datenverkehr sehen, der Ihre Datei überträgt.

Ist das wirklich kostenlos?

Ja. Keine Anmeldung, kein Kontingent, keine Upgrade-Stufe. Die Konvertierung läuft auf Ihrem Rechner, das Hosten kostet uns also nichts.