Spezialisierter Konverter · läuft zu 100 % in deinem Browser

PDF zu durchsuchbarem PDF OCR

Einem gescannten PDF eine unsichtbare OCR-Textebene hinzufügen, damit es durchsuch- und indexierbar wird, während die ursprünglichen Seitenbilder erhalten bleiben. Jede Seite wird gerendert, per OCR verarbeitet und mit dem Text in den korrekten Koordinaten über dem Bild neu erstellt. Die Ausgabe ist ein Standard-PDF, das in jedem Reader geöffnet werden kann.

Kein UploadKeine RegistrierungKein TrackingKostenlos, unbegrenzt
PDF-Datei hier ablegen
oder klicken, um eine Datei auszuwählen

So wird's gemacht

  1. PDF-Datei ablegen.
  2. Die Sprache des Dokuments aus dem Dropdown auswählen.
  3. Tesseract.js lädt die Sprachdaten (~10 MB pro Sprache, nach der ersten Verwendung gecacht).
  4. OCR läuft lokal und die durchsuchbare PDF-Ausgabe wird zum Download angeboten.

FAQ

Wie genau ist die OCR?

Tesseract ist eine der besten Open-Source-OCR-Engines. Für klaren, modernen Text ist sie in der Regel 95–99 % genau. Handschrift, kontrastarme Scans oder ungewöhnliche Schriftarten können die Genauigkeit deutlich verringern.

Warum dauert die erste Konvertierung länger?

Der erste Durchlauf lädt ~10–15 MB Sprachdaten herunter. Danach werden diese für den Rest Ihrer Sitzung gecacht.

Wird mein Dokument oder Bild auf einen Server hochgeladen?

Nein. Die Konvertierung läuft vollständig in deinem Browser über WebAssembly und Web-APIs. Öffne den Network-Tab in den DevTools während der Konvertierung — du wirst keinen ausgehenden Traffic sehen, der deine Datei überträgt.

Ist das wirklich kostenlos?

Ja. Keine Anmeldung, kein Kontingent, keine Upgrade-Stufe. Die Konvertierung läuft auf deinem Gerät, daher entstehen uns keine Hosting-Kosten.