Gespecialiseerde converter · werkt 100% in uw browser
PDF naar TXT OCR
Extraheer tekst uit een gescande of op afbeeldingen gebaseerde PDF met behulp van OCR (Tesseract.js + pdf.js). Elke pagina wordt op een canvas weergegeven en met OCR uitgevoerd. Werkt voor documenten waarin de tekst niet selecteerbaar is. De voortgang over meerdere pagina's wordt weergegeven terwijl de conversie wordt uitgevoerd.
Hoe te gebruiken
- Zet uw PDF-bestand neer.
- Kies de taal van het document in de vervolgkeuzelijst.
- Tesseract.js laadt de taalgegevens (~10 MB per taal, in de cache opgeslagen na het eerste gebruik).
- OCR wordt lokaal uitgevoerd en de TXT-uitvoer wordt aangeboden om te downloaden.
Veelgestelde vragen
Hoe nauwkeurig is de OCR?
Tesseract is een van de beste open-source OCR-engines. Voor heldere, moderne tekst is deze doorgaans 95-99% nauwkeurig. Handschrift, scans met laag contrast of ongebruikelijke lettertypen kunnen de nauwkeurigheid aanzienlijk verminderen.
Waarom duurt de eerste conversie even?
Bij de eerste run worden ongeveer 10-15 MB aan taalgegevens gedownload. Daarna wordt het voor de rest van uw sessie in de cache opgeslagen.
Wordt mijn document of afbeelding geüpload naar een server?
Nee. De conversie wordt volledig in uw browser uitgevoerd met behulp van WebAssembly en Web API's. Open het tabblad Netwerk in DevTools terwijl u converteert. U ziet geen uitgaand verkeer dat uw bestand vervoert.
Is dit echt gratis?
Ja. Geen aanmelding, geen quota, geen upgradelaag. De conversie draait op uw machine, dus het kost ons niets om te hosten.